Está en la página 1de 48

UNIVERSIDAD PERUANA DE CIENCIAS APLICADAS - EPE

Data Science Foundations

PROFESOR DEL CURSO: Balarezo Perea, Norma Silvana

Grupo 4

SECCIÓN: AP259- 2202-QD2A

SEGUNDO AVANCE

% DE
INTEGRANTES CODIGO
PARTICIPACION

Betzabeth Maybee Salazar Lujan U201723858 RETIRADO

García Trigo Oscar Gabriel U201222326 100%

Ludeña Urbina Renatta Michelle Claudia U20181D359 100%

Magallanes Llerena, Prisyla Anameli U201916596 100%

Nolazco Vásquez Antonia Silvia U201922216 100%

Taípe Garay, Joel Julio 100%


U201919836

Setiembre, 2022
INDICE

- CAPÍTULO 1: PRESENTACIÓN DE LA EMPRESA PARA EL PROYECTO Y

FORMACIÓN DEL EQUIPO DE CIENCIA DE DATOS 4

- INTRODUCCIÓN 4

1.1 PRESENTACIÓN Y DESCRIPCIÓN DE LA EMPRESA 4

1.1.1 HISTORIA 4

1.1.2 MOTIVO DE INVESTIGACIÓN 6

1.1.3 EVOLUCIÓN 7

1.1.4 MISIÓN 7

1.1.5 VISIÓN 7

1.1.6 PLAN ESTRATÉGICO INSTITUCIONAL RENIEC 8

1.1.7 PLAN ESTADÍSTICO RENIEC 2022 9

1.2 OBJETIVOS INICIALES DEL PROYECTO 10

1.2.1 OBJETIVOS GENERALES 10

1.2.2 OBJETIVOS ESPECÍFICOS 10

1.2.3 IDENTIFICACIÓN DEL PROBLEMA 11

CAPÍTULO 2: COMENZANDO EL PROYECTO 16

- A) PREGUNTAS PRINCIPAL: 16

- B) PREGUNTAS SECUNDARIA: 16

- C) ENFOQUE ANALÍTICO (DESCRIPTIVO DIAGNOSTICO) 16

- CAPÍTULO 3: PLANIFICANDO LA EJECUCIÓN DEL PROYECTO 17

a) Preparación del plan de trabajo para el desarrollo del proyecto 17

- OBJETIVO LE PROYECTO 17

- ROLES DEL EQUIPO DE CIENCIA DE DATOS QUE SE ENCARGA DEL PROYECTO 17

b) Actividades para realizar en cada uno de los pasos que propone la metodología 19

- METODOLOGÍA EMPRESARIAL 19

- FORMULACIÓN DE PREGUNTAS PARA DATA SCIENCE 21

- REQUISITOS DE DATOS 21

- RECOPILACIÓN DE DATOS 21

2
- COMPRENSIÓN DE DATOS 23

- PREPARACIÓN DE DATOS 25

- MODELADO 26

- EVALUACIÓN 27

- IMPLEMENTACIÓN 27

- PREPARACIÓN DE MODELO 28

- COMENTARIOS 29

- INSUMOS Y ENTREGABLES 1

- ELABORACIÓN DEL GANTT 4

- ANÁLISIS DEL CONJUNTO DE DATOS Y DASHBOARD DEL PROYECTO 6

A) ANÁLISIS DEL CONJUNTO DE DATOS UTILIZANDO PYTHON: 6

B) RESUMEN DESCRIPTIVO: 8

C) GRÁFICOS COLAB EN BASE A PYTHON: 9

- CONCLUSIONES 12

- REFERENCIA 1

3
- CAPÍTULO 1: PRESENTACIÓN DE LA EMPRESA PARA EL PROYECTO Y

FORMACIÓN DEL EQUIPO DE CIENCIA DE DATOS

- Introducción

En el presente trabajo identificamos la problemática de la falta de accesibilidad por

parte de la RENIEC para datos de estado civil, identificación, renovación, entre otros para

las personas que habitan dentro de comunidades nativas alejadas de las ciudades. Por qué

razones los habitantes se ven afectados tener documentación virtual o física actualizada, lo

cual dificulta posibles trámites, procesos e incluso registros de salud. El trabajo tiene como

sustento data de origen libre la cual permitirá identificar la problemática de manera correcta,

y concisa para unas próximas vías de solución que garanticen la resolución de la

problemática.

1.1 Presentación y descripción de la empresa

1.1.1 Historia

La empresa de Registro Nacional de Identificación y Estado Civil es un organismo

público que realiza la identificación de todos los ciudadanos peruanos y otorgan el

documento nacional de identidad del país Perú registrando los hechos civiles como son:

nacimientos, matrimonios, divorcios, defunciones, y otros más (RENIEC, 1993)

La empresa Reniec (Registro nacional de Identificación y Estado Civil) tiene una

gran importancia en el país, ya que desde su creación en 1993 se tiene la observación y

creencia que es el organismo de más confianza en el país, por lo que permite conocer el

número de ciudadanos menores de edad, número de población, número de fallecidos,

personas casadas, divorciadas o las personas que han nacido y no han tramitado su

documento nacional de identidad entre otros motivos.

4
La Reniec emite el DNI (Documento Nacional de Identidad) que es el Documento

Nacional de Identidad, por lo que este documento permite realizar todo tipo de trámites

legal y judicial al ciudadano, como también identificarse y realizar la votación por el

mandatario peruano que se lleva a cabo en elecciones donde la Reniec también realiza una

participación en el proceso electoral.

DNI es el documento nacional valido en el país el cual sustituyo a la libreta electoral

que fue creada en 1931 y que fue el documento válido para realizar votaciones en el pasado.

DNI para menores de edad y de color amarillo fue creado en el año 2002 con la

finalidad de poder identificar a todos los recién nacidos hasta los adolescentes de 17 años y

364 días, ya que a pesar de existir un control de nacimientos y saber que estas personas

existen, no se tenía forma de identificarlos salvo la partida de nacimiento.

Hemos visto como la entidad ha evolucionado y teniendo un crecimiento sostenible

en la documentación de identificación y el control de todo el tema civil de los ciudadanos,

pasando desde documentación de la libreta de manera manual hasta llegar a documentación

tecnológica y electrónica, lo que hace y permite estar a los ciudadanos mucho más cerca de

las facilidades de acceso a ser reconocidos, el ingreso a programas sociales y de salud, a sus

derechos y a la tramitación de por ley que necesitan.

La Reniec trabaja para poder brindar servicios de manera amigable a todos los

ciudadanos peruanos asegurando todos sean integrados al sistema. Asimismo, garantiza la

seguridad e identidad para mejorar la información y modernización del país en el estado

peruano, cabe resaltar que su actividad es promover el proceso de identificación social y

enfoque de varias culturas.

5
1.1.2 Motivo de investigación

La importancia de Reniec va mucho más allá de lo que se tiene entendido o alguna

vez se ha pensado, ya que tener una información real, actualizada y certera apoya a

fortalecer los registros de identidad para beneficio de todos los ciudadanos. Asimismo, y en

el punto que nos estamos centrando para el presente trabajo es mejorar los servicios

registrales de la identidad y su identificación en situación vulnerable y personas nativas, ya

que nos basaremos en la información y data obtenida para determinar cuántas personas no

han tramitado su DNI, y cuáles son los lugares en los que ha sucedido con mayor intensidad

o frecuencia, por lo que esto puede ver varios temas y con ello poder ver la vulnerabilidad

de la población o las dificultades que se suscitan en el proceso en accesibilidad, ubicación,

recursos o por desconocimiento o falta de educación.

En la actualidad a pesar de todas las facilidades y tecnologías aún existen menores

de edad que carecen de una partida de nacimiento siendo la selva y otros departamentos más

afectados, ya que existe un alto nivel de necesidades básicas y precariedades con bajo nivel

de instrucción y por ende conllevan a no contar con documento nacional de Identidad, hecho

o forma de vida que se traslada lamentablemente de manera generacional.

Todos los peruanos debemos tener acceso a los procesos que faculta la constitución

nacional, por lo que no tramitar el DNI elimina, limita o restringe al ingreso de cualquier

derecho que por ley te corresponde, por lo que realizar el trámite permitirá la fácil

identificación y acceso a la identidad como lo dice la ley, así como también la expresión

autentica que se valida en las votaciones según el artículo 176 de nuestra constitución

(Reniec, 1993) (RENIEC, 1993).

Hoy en día se hace difícil pensar el no tener un organismo que realice todas las

actividades civiles, ya que la importancia directa de saber la población y su vínculo civil

6
hace más fácil el reconocimiento y acceso laboral al sector empresarial del país. Tener un

DNI es de suma importancia, ya que no solo te brinda accesos y derechos sociales sino te da

la oportunidad de poder obtener accesos al trabajo y a una vida digna.

1.1.3 Evolución

 1931 creación del Registro Electoral del Perú, se creó la Primera Libreta

Electoral

 1946 e implementa la huella digital y sello de Registro Electoral.

 1978 implementación del registro nacional de analfabetos.

 1963-1983 Implementación de la libreta electoral 3 cuerpos.

 1984-2004 Implementación de 8 dígitos en el Documento o libreta electoral.

 1996-1998 Implementación de la información de manera computarizada en la

libreta electoral.

 1997-1999 Implementación de la libreta provisional, debido a la falta de

identificación por atentados terroristas.

 1997-2005 Creación del DNI.

 2002-2005 Creación del DNI menor de edad.

1.1.4 Misión

“Registrar la identidad, los hechos vitales y los cambios del estado civil de las

personas. Participar del sistema electoral y Promover el uso de identificación y certificación

digital, con inclusión social u enfoque intercultural.” (Reniec, 2022)

1.1.5 Visión

Según Reniec la visión es “Ciudadanos identificados con acceso a servicios

amigables e innovadores en tiempo real, integrados digitalmente a través de la entidad de

7
registro del Estado peruano que garantiza su identidad y seguridad jurídica, y que contribuye

a la modernización del Estado y al desarrollo del país.” (Reniec, 2022).

1.1.6 Plan estratégico Institucional Reniec

Reniec mantiene su plan estratégico el cual se elabora por periodos de 5 años el cual

tiene como propósito apoyar y mejorar el bienestar de los ciudadanos, cuya base principal se

encuentra en la Ley 26497 que está relacionada a la Entidad, ya que sus objetivos están

enlazados al plan estratégico y la imagen que se quiere dar al futuro del país.

Toda Institución pública o del estado debe tener un plan estratégico institucional que

tiene que tener por lo menos cada 5 años y existe una comisión que redacta el plan

estratégico de la institución el cual en dicha plan intervienen varias organizaciones y

unidades que formulan una nueva dirección el cual contiene una serie de indicadores

medibles que llevaran y dará dirección a la misión de la institución y acciones que mediante

la estrategia y uso de recursos se convertirán en procesos y actividades junto con

operaciones que llevaran los planes de operaciones que tendrán un financiamiento anual que

dará como norte beneficios en bienes y servicios a la población que utiliza a la Reniec como

un organismo público.

El plan estratégico el cual tiene Reniec tiene como fin mejorar la calidad de servicio

de la organización para volver más eficaz y eficiente brindando mayor facilidad y acceso a

cualquier persona y organismo mediante el uso de nuevas tecnologías, sistemas y seguir

consolidándose como institución pública.

8
Tabla 1
Objetivos Estratégicos Institucionales (OIE)

Nota: OPP/Unidad de Planificación y Estadística

1.1.7 Plan Estadístico Reniec 2022

La Reniec tiene un plan estadístico el cual su principal objetivo es obtener

información basada en todo el contenido que mantiene las bases o contenidos desde la

Reniec para poder tomar decisiones y convertirlas o transformarlas en planes de acciones

nuevas políticas y futuros proyectos.

El plan estadístico contiene varios objetivos específicos que permitirán saber las

competencias de la Reniec logrando facilitar la información importante para poder sostener

la información de usuarios y solicitudes y trabajos tanto internos como externos de la

institución.

9
Asimismo, la Reniec tiene que dar las facilidades a toda la información que ellos

contienen ante cualquier organismo gubernamental que lo solicite y así poder tener

excelentes resultados en los análisis y estudios que se realizan.

Asimismo, dar proyecciones en la realización de pedidos de tramites civiles para

estimar tiempos y atenciones que se requieran para poder ver el éxito y logros de los

objetivos de la organización.

Otro punto importante es asegurar la información secreta y privilegiada teniendo

respaldos ante cualquier emergencia o situación que suceda para evitar perder la

información siempre con miras al fortalecimiento de mejorar y atención al servicio al

ciudadano teniendo como comunicación a través de los medios oficiales de la Reniec.

1.2 Objetivos iniciales del proyecto

1.2.1 Objetivos generales

● Determinar la cantidad de personas nativas que no hayan tramitado su DNI

en los departamentos de Perú del año 2022

1.2.2 Objetivos específicos

● Identificar los departamentos que no han tramitado su DNI

● Identificar las principales razones por las que las personas no tramitan du

DNI

● Implementar un plan de acción para incrementar DNI tramitados.

10
1.2.3 Identificación del problema

El objetivo de Reniec es poder registrar la identidad, y los hechos vitales y los

cambios de estado civil de las personas; como también promover el uso de la identificación

y certificación digital. Sin embargo, a pesar de las atenciones registrales, hay tramites que

no están siendo efectuadas, por lo tanto, Reniec deberá fortalecer las acciones para

garantizar el derecho de identidad a las personas que viven en las comunidades nativas más

alejadas de nuestro país, ya que no cuentan con un documento de identidad el cual las

identifique. Asimismo, se puede observar en la data obtenida que un gran sector de personas

y/o familias pertenecientes a la población indígena podrían verse limitados por diversos

motivos por el cual no puedan tramitar su documento de identidad.

Se ha realizado una distribución del Perú en 24 departamentos más afectados de las

comunidades nativas, las cuales el tipo de trámite que ellos realizando es por renovación,

duplicado e inscripción por primera vez, en el cual las personas indígenas realizan el trámite

en los centros de la Reniec más cercano, una vez realizado el trámite se cuenta con

deficiencia de las atenciones registrales al no tramitar el DNI o por no ser entregado por las

diferentes dificultades que se tiene. Se muestra en la siguiente tabla:

11
Tabla 2
Lista de departamentos y tipo de tramite según tipo de DNI tramitado

Fuente: Elaboración propia

Agrupando las cantidades de trámite no realizados (en total 317,999.50 millones de

personas por los veinticuatro departamentos de Lima), se ubicó Pasco, Huánuco siendo los

departamentos con más comunidades nativas que no han tramitado su documento de

identidad.

En el siguiente grafico N. º 1 se puede observar que Pasco es el departamento con la

mayor cantidad que no cuentan con un documento de identidad, se puede percibir que puede

haber una deficiencia de atención o por motivos de lejanía o motivo económico las personas

nativas no pueden obtener un documento que les pueda identificar.

12
Gráfico 1
Cantidad de documento de identidad no tramitado y entregado

Fuente: Elaboración propia, 2022

En el grafico presentado se puede observar el tipo de trámite que las personas

realizan en Reniec por departamento y género, se puede identificar que el 37.70% de los

hombres y el 37.12 % de mujeres es el porcentaje más alto, en el cual el tipo de trámite que

ellos realizan es por renovación y/o rectificación, según Reniec (2022) indica que, se deberá

realizar por la página web para el caso de menores de edad y personas con discapacidad.

Esto puede verse afectado, ya que las personas nativas se pueden perjudicar de diversas

formas como la falta de conocimiento de las páginas web, idioma, relaciones culturales y la

dificultad para acceder a los lugares de inscripción, es por ello por lo que es necesario poder

aumentar la eficiencia de los procedimientos de registro, así como también la reducción de

costos y el conocimiento de la lengua originaria de la zona por parte de los funcionarios que

afecta un problema en la comunicación.

13
Gráfico 2
Cantidad de trámite realizado por departamento según genero

Fuente: Elaboración propia, 2022

Fuente: Elaboración propia, 2022

En el siguiente gráfico presentado podemos observar la cantidad de trámites

realizados de: duplicado, inscripción por primera vez, renovación o rectificación. A su vez

se está filtrando por género femenino y masculino. Se observa que por duplicado el número

en hombres es de 84,000 y en mujeres es 1020.00.

14
Por otro lado, la inscripción por primera vez en hombres llega a un número de

2440.00 y mujeres a 2177.00 y por último se observa que las personas que realizan

renovación y rectificación ascienden en hombres a 7189.00 y en mujeres a 7079.00 tramites.

Gracias a esta data se puede llegar a la conclusión que los trámites más realizados

son renovación y rectificación, esto puede estar sucediendo porque no existe la suficiente

información o infraestructura por parte del estado para solucionar este problema.

El lenguaje, la ubicación ni la tecnología debería ser un impedimento para que estas

personas realicen sus trámites con rapidez y facilidad en comparación a los habitantes de la

ciudad.

Gráfico 3
Cantidad de trámite realizado por género

Fuente: Elaboración propia, 2022

15
Fuente: Elaboración propia, 2022

CAPÍTULO 2: COMENZANDO EL PROYECTO

- a) Preguntas principal:

¿Por qué se ha incrementado la cantidad de DNI no tramitados de personas nativas en los


departamentos del Perú durante el 2022?

- b) Preguntas secundaria:

1. Identificar la cantidad de DNI emitidos durante el primer trimestre por género?

2. ¿Cuál de los departamentos tiene el mayor índice de DNI no tramitados? bien

3. ¿Qué tipos de trámite se realiza en la RENIEC, para identificar aquellas gestiones

con mayor demanda? bien

4. ¿Cuáles son los periodos del año con más solicitudes de tramites de DNI no

tramitado en las zonas nativas?

- c) Enfoque analítico (Descriptivo diagnostico)

Para poder analizar los datos que hemos obtenido utilizaremos el modelo descriptivo

diagnóstico, gracias al modelo descriptivo podremos saber qué es lo que está pasando,

podremos entender el por qué las personas nativas no han tramitado su DNI (Documento

Nacional de Identidad), entenderemos si es por una cuestión de falta de información o una

16
situación de machismo, analizaremos también que departamento del Perú tiene el mayor

índice de DNI no tramitado, así como en que periodos del año hay más solicitudes. Los

datos que se están utilizando son datos abiertos, abarca el año 2022 por último, analizaremos

esta valiosa información para así poder contestar a las preguntas sobre nuestra investigación.

- CAPÍTULO 3: PLANIFICANDO LA EJECUCIÓN DEL PROYECTO

a) Preparación del plan de trabajo para el desarrollo del proyecto

- Objetivo le proyecto

El objetivo inicial del proyecto es obtener datos específicos de las personas nativas

que no han podido tramitar su documento de identidad, donde se podrá identificar cuáles

son los motivos por el cual surge una deficiencia de los funcionarios al no poder solucionar

el problema que ocasionan, ya que las personas no pueden obtener un documento el cual se

identifiquen como persona natural dentro del territorio peruano. A su vez, esta deficiencia

puede perjudicar al no obtener apoyo del estado como atención humanitaria, entrega de

bonos económicos o canasta familiares.

La propuesta del equipo de ciencia de datos es desarrollar una estrategia basada en

un insight que nos permitirá obtener un contexto específico, para poder producir acciones

estratégicas, el cual será un factor importante para poder entender exactamente la

problemática, y descubrir la ineficiencia de los tramite no realizados.

- Roles del equipo de ciencia de datos que se encarga del proyecto

El equipo de ciencia de datos al que se le encargó el proyecto está conformado por 4

integrantes, cada uno experto en análisis de problemáticas y creación de estrategias para

poder mitigar estas problemáticas encontradas. A continuación, presentaremos al Equipo de

Ciencia de Datos:
17
ROL Líder de Proyecto

 Es la persona que guiará y trabajará mano a mano


con los científicos de datos, una de sus funciones
es organizar las actividades.
 Hará una revisión del desempeño general del
equipo.
FUNCIONES
Dado que se cuenta con pocos recursos para el proyecto
y tomando en cuenta su experiencia este especialista
también desarrollará labores operativas junto con el
equipo de ciencia de datos relacionadas al diseño de la
arquitectura al rol de los arquitectos e ingenieros de
datos.
Características del Rol  Administrará las actividades diarias y reuniones
con los científicos de datos.
 Brindará feedback el quipo.
Rol Asignado
Renatta Ludeña Urbina

Experiencia Con 3 años de experiencia, organizando equipos de


trabajo multidisciplinarios en el área de tecnología de
información, redes sociales, comunicaciones, desarrollo de
programas dentro del sector de inteligencia UNITIC –
DIRSAPOL.

Rol Científicos de Datos

Funciones  Serán los encargados de recolectar, extraer y


analizar los datos que ayudarán alimentar el
proyecto.
 Realizaran reuniones diarias, trabajaran en equipo
 Comunicaran su avance hasta el término del
proyecto a la gerencia y a los líderes del
proyecto.
 Elaborar informes basado en análisis y
sustentaran a la gerencia.
 Usar modelos computarizados para extraer datos
 Diseñar la estructura de los datos en plataformas
para una mejor comprensión de los datos
 Se encargará de recopilar, organizar y limpiar los
datos que usaran los científicos de datos

18
Características del Rol  Manejar una excelente comunicación verbal y
visual en la narración de datos
 Poseer creatividad y curiosidad en el análisis de
datos
 Procesar datos usando diferentes métodos
estadísticos, informáticos y matemáticos
 Capacidad lógica
 Aprendizaje rápido
Magallanes Llerena, Prisyla
Con más de 2 años en el rubro financiero, y asesoramiento
en transferencia de gestión.
García Trigo, Oscar
Con 14 años de Experiencia en Banca.
Con más de 3 años en experiencia en ventas.
Taípe Garay, Joel
Miembro del Equipo Con 5 años de Experiencia de Publicidad, desarrollo de
campañas publicitarias y manejo de clientes.

Fuente: Elaboración Propia, 2022

Nota: La tabla muestras las características y funciones de un líder y un científico de datos.


Tomado de Científico de datos: Harvard Business Review.

b) Actividades para realizar en cada uno de los pasos que propone la metodología

- Metodología empresarial

En nuestro país la institución responsable del RENIEC. Según la autora (Ivon, 2022)

el artículo de investigación menciona que RENIEC, es considerada como la institución del

Estado Peruano, en tiempos de pandemia, como la más eficiente, y que va la vanguardia de

los demás, por implementar tecnología aplicando procesos para cumplir de manera óptima

con el servicio que tiene como parte del Estado. Sin embargo, la autora menciona que,

cuando se evalúa los logros importantes, se obtiene como resultado una data digital oficial

de la población peruana total, y menos si se solicita en tiempo real. Por otro lado, menciona

que espera verificar los segmentos, grupos de peruanos y otros, lo que demuestra en la era

de la globalización y de internet, se puede decir, por lo que representa la data para el Estado

Peruano, un atentado contra la Seguridad Nacional.

19
Por su lado, la data digital, se define como el conjunto de datos que aparecen en un

determinado sistema. Mediante esta información útil e inmediata, se convierte en primero en

básica posterior en estructural para el verdadero desarrollo del país. También, mencionamos

que dentro de la población peruana se encuentra la población nativa más alejada de nuestro

país, que no cuentan con un documento de identidad que les permita identificarse. De

acuerdo con los reportes que nos contempla la data digital de nuestra institución, un gran

sector de familias pertenecientes a poblaciones nativas se ve limitadas en el acceso de salud

o a diversas medidas de atención humanitaria que ofrece el estado peruano. Con ello, se

evidencia que muchas de las poblaciones son invisibilidades por el Estado, incluso durante

la pandemia y crisis sanitaria del año 2022.

Por otro lado, nuestra problemática es identificar el incremento de pobladores

nativos que no cuentan con su documento de identidad durante el año 2022, nuestras

herramientas de trabajo son datas digitales que se obtuvo dentro de los organismos del

estado como son: cantidad de trámites de DNI realizados y no realizados a personas de

comunidades nativas y centros poblados en registros itinerantes a través del Registro

Nacional de Identificación y Estado Civil (RENIEC), cantidad de personas por sexo y

departamento a través del Instituto Nacional de Estadística e Informática (INEI). Además,

hemos utilizado plataformas educativas, del gobierno donde nos permitirá hacer un análisis

profundo de cómo está la situación de los centros poblados en las zonas rurales.

Podemos concluir, dentro de la institución Reniec, surge la iniciativa por modernizar

los sistemas haciendo referencia a la tecnología, implementando nuevos procesos de manera

que se vea reflejado en la data digital, siendo más efectiva el registro de ciudadanos en

tiempo real. Así mismo, mostrar la cantidad de personas registradas en los centros poblados.

20
- Formulación de preguntas para Data Science

El objetivo principal es determinar el enfoque más adecuado, para el desarrollo de

este se va a definir un enfoque descriptivo, lo que se busca es identificar el por qué se ha

incrementado la cantidad de DNI no tramitados, delimitar cuales son las causas y a partir de

esto definir las acciones necesarias mediante data digital y herramientas que proponemos en

nuestro proyecto de Data Science.

- Requisitos de datos

En esta etapa vamos a determinar los datos necesarios para el proyecto acorde al

problema identificado, al que buscamos dar solución, además, se propone identificar los

datos extraídos

Para el desarrollo del proyecto, se va a requerir la siguiente data donde se visualiza

los tramites de DNI realizados y no realizados de la población nativa a nivel país.

- Recopilación de datos

Luego de poder hacer la compresión de las necesidades, definido los objetivos y de

haber formulado las preguntas, se da inicio al proceso de definir los requisitos de datos para

luego poder realizar la recopilación de los mismo en la búsqueda de atender las preguntas y

objetivos planteados para nuestra investigación.

Para identificar los datos requeridos hemos tomado como fuente de información

pública en los portales de datos abiertos, como Instituto Nacional de Estadística e

Informática (INEI), transparencia de datos del Gobierno del Perú y de los Ministerios de

Economía y Finanza (MEF (Ministerios de Economía y Finanza)), Registro Nacional de

Identificación y Estado Civil (RENIEC), de tal manera que los conceptos presentados a

continuación sean adecuados y fehaciente.


21
Durante el proceso de recopilación de datos se ubicó que, en el caso de algunos de

los datos públicos es información que en la plataforma de datos abiertos es de estado de

archivo de formato de texto separado por comas, Excel, o archivos zip, para que sean

descargados por quienes quieren trabajar con la información.

Asimismo, hemos identificado que en algunos casos había datos de gran volumen

(archivos .csv) y no podían ser descargados directamente de una hoja Excel y que se

sobrepasaba de la capacidad de numero de filas soportada por el programa.

Además, de haber explotado las plataformas de datos abiertos, transparencia de

datos, se evaluó si los datos recopilados fueron suficientes para responder las preguntas y

objetivos iniciales de la investigación. Además, se ha revisado los requisitos de datos y se

inició el proceso de recopilación con el objetivo de determinar la cantidad de datos para el

trabajo.

Gráfico 4
Portal de Transparencia de datos del Gobierno del Perú

Fuente: Plataforma nacional de datos abiertos

22
En la etapa de recopilación hemos utilizado técnica de visualizaciones de datos para

poder determinar la consistencia de lo mencionado, por ende, se ha utilizado la estadística

descriptiva y gráficos.

Gráfico 5
Trabajo con técnicas estadísticas

Fuente: Elaboración propia, 2022

- Comprensión de datos

Los datos seleccionados para el trabajo en su mayoría están elaborados de cierta

forma que nos hemos dado cuenta de que, pese a la existencia de procedimientos

establecidos para la publicación de datos de las plataformas de acceso y transparencia de

información del Estado, hemos encontrado solo un problema como, por ejemplo:

 Existen diversas publicaciones referidas a los mismos datos o con el mismo nombre

de archivo.

Gráfico 6
Publicaciones de datos repetidos en la plataforma de datos abiertos

23
Fuente: Plataforma Nacional de Datos Abiertos

Gráfico 7
Archivos de Datos voluminosos

Fuente: Elaboración propia, 2022

24
- Preparación de datos

Dentro de la base de datos hemos verificado que tenemos la Data de todos los

departamentos del Perú, por lo que es esencial eliminar o desechar los datos que contengan

personas no nativas, ya que no es el foco de nuestra pregunta de investigación. Asimismo,

tenemos que eliminar la data de Inscripción por primera vez, ya que el dato es irrelevante

para poder identificar el problema y conseguir información útil en el problema de

investigación. Adicionalmente dentro de la data hemos buscado datos duplicados los cuales

no fueron encontrados, ya que al utilizarlos podría llevarnos al error o presentar fallas en los

resultados que se obtendrán.

La data con la que se trabaja tenía una forma estructurada, por lo que daba soporte y

apoyo a una facilidad de manejo de la información como lo son los siguientes datos:

Gráfico 8
Utilizar la data

Fuente: Elaboración propia, 2022

25
Gráfico 9
Figura tipo de trámite

Fuente: Elaboración propia, 2022

Gráfico 10
Figura duplicidad de datos

Fuente: Elaboración propia, 2022

- Modelado

El Modelo utilizado para poder preparar la respuesta a nuestra pregunta será el

modelo descriptivo diagnóstico, ya que abrirá las puertas para con la información obtenida

en la preparación de datos saber la cantidad de las personas que no han tramitado sus DNIS

en las comunidades nativas. Asimismo. Con la información obtenida en la preparación de

datos podremos explicar los lugares que tienen mayor incidencia de DNI no tramitados y si

esto es una tendencia o se encuentra en incremento, ya que denotaría un problema que está

sucediendo y se encontraría agravándose con el tiempo, por lo que tendríamos la suficiente

26
capacidad de demostrar que se tiene un problema y conocer los lugares donde está

sucediendo con mayor frecuencia.

- Evaluación

El equipo ha construido un modelo que pueda ser aplicado y pueda dar como

resultado información suficiente y de calidad para que el equipo se encuentre satisfecho

como analistas o científico de datos.

Es necesario realizar pruebas y evaluar los distintos escenarios y resultados, ya que

así podremos darnos una idea o verificar si se pudo dar con el resultado deseado y resolver

los objetivos trazados desde el comienzo del proyecto, por lo que si el equipo no ha

considerado algún dato o no consiguió determinar o dar como resultado la respuesta del

objetivo volverlo a analizar y tomar el tiempo necesario hasta conseguirlo, por lo que si se

logró el objetivo del proyecto se deberá tomar las decisiones pertinentes para aplicar los

resultados obtenidos

- Implementación

Para la implementación del modelo seguiremos los 5 pasos desde el Kick Off hasta

el Live paso a paso iremos explicando el proceso:

1: Definición final de usuarios del modelo: en este proceso ya tendremos definidos

los usuarios del modelo, el usuario será RENIEC, pues gracias a la data analizada

evidenciaremos que existe un problema el cual no se está prestando atención.

2: Creación de cronograma de implementación: para este apartado se creará un

cronograma detallado con las fechas de entrega, reuniones pactadas y revisiones del modelo.

27
3: Herramientas para el uso del modelo: para desarrollar el modelo se usarán

herramientas de visualización de datos, el programa Excel nos ayudó a recopilar los datos,

filtrarlos, organizarlos y depurarlos. El filtro que tenemos es “Población no identificada con

DNI”, “Cantidad de trámite realizado por género”

Una vez terminada esta primera fase, se hará una reunión con los interesados para

poder verificar si toda la información recopilada y analizada esta correcta, o es necesario

hacer algún cambio.

- Preparación de modelo

1: Verificación de la carga de los datos: una vez revisados todos los datos depurados

y revisados se subirán se procederá con el siguiente paso.

2: Actualización de datos y gestión de soporte: al nosotros trabajar con datos

históricos, estos no se actualizarán ya que estamos analizando por qué está ocurriendo la

falta de DNI en estos pueblos nativos en un periodo de tiempo determinado, la gestión de

soporte se realizará con reuniones con el equipo para verificar la funcionalidad del modelo.

3: Gestión del cambio: dentro de los procesos de gestión del cambio que

utilizaremos está el diagnóstico que mediante una reunión analizaremos que es lo que está

faltando luego se comunicará a los interesados el problema o hallazgo nuevo y a este se le

hará un seguimiento para poder contemplarlo dentro de la investigación.

Coordinaciones y capacitaciones

1: Primero se tendrá que definir la cantidad de capacitaciones y reuniones con

RENIEC para que revisen y enseñarles cómo funciona el modelo elaborado.

28
2. Se capacitará desde las bases hasta lograr explicar la función total del modelo

construido.

Puesta en marcha

1: Se realizarán pruebas en ambientes seguros para poder evaluar el desempeño del

modelo y verificar errores.

2: Se comenzará con la carga de datos y se empezarán a analizar en vivo.

- Comentarios

Finalmente, en esta etapa del proceso recopilaremos los comentarios y cambios que

tienen las personas a las que se le presentó el proyecto (RENIEC) para así nosotros

analizarlas y ajustar el modelo y este mejore, gracias a estos comentarios podremos realizar

los cambios para poder plantear el problema de una manera más clara y concisa. Se

realizarán reuniones con RENIEC para así poder tener estos cambios y comentarios lo más

antes posible para hacer las modificaciones prácticamente en vivo.

29
- INSUMOS Y ENTREGABLES

INSUMOS ACTIVIDADES RESPONSABLES RESULTADOS

Presentación de
Tipos de DNI no tramitado
COMPRENSION los tramites de DNI
EMPRESARIAL Renatta Ludeña
Selección de la empresa Estudiar el organismo público
Información del Organismo Público
a realizar el estudio (RENIEC) Renatta Ludeña

Describir el problema en la
Información descriptiva actualidad e identificar porque no Identificar el origen de los DNI
diagnóstico se están tramitando los DNI a los no entregados
ENFOQUE
ciudadanos
ANALÍTICO
Renatta Ludeña
Información recopilada y Analizar que está sucediendo en
Identificar la problemática de la RENIEC
formación de preguntas el Sector Público Renatta Ludeña

REQUISITOS Organización para la extracción Indagar base de datos sobre Identificar y buscar la data necesaria
DE DATOS de datos los DNI no tramitados para la plantación del problema
Renatta Ludeña

Se acumularán los datos necesarios para


Recopilación de Verificar si los datos obtenidos
hallar la identificación del problema de los
información de los datos están completos
DNI no tramitados
RECOPILACIÓN
DE DATOS
Prisyla Magallanes
Con la información obtenida nos
Recaudación de información
ayudará a enriquecer la base de
de diferentes fuentes
datos Prisyla Magallanes
Examinar que los espacios en
Revisión de datos existentes
blanco no afecten al análisis Prisyla Magallanes
Realizar diferentes gráficos que
ayuden a la investigación
COMPRESION Extraer información
DE DATOS almacenada

Prisyla Magallanes

47
Realizar algunos métodos para la Se estudiará la base de datos para
Plantear el problema
comprensión de datos plantear del problema
Prisyla Magallanes
Eliminar la duplicidad de
PREPARACIÓN información Obtención de datos calidad para poder
Utilización de la data
DE DATOS Eliminación de data innecesaria demostrar el problema
Estructurar la data Prisyla Magallanes
Revisar si el modelo elegido es
Crear un modelo óptimo para la
MODELADO favorable para la pregunta de Elección del modelo para la investigación
investigación
investigación
Joel Taípe

Arranque de la implementación Se proyectará el modelo planteado y


en RENIEC aprobado para disponer de su ejecución

Joel Taípe

Preparación del modelado

IMPLEMENTACIÓN Entender el modelo evaluado


Joel Taípe

Coordinaciones y capacitaciones
con
los encargados de RENIEC

Joel Taípe

Puesta en marcha / Ejecución

Joel Taípe

47
Optimización y mejoras con los
representantes de la RENIEC

Oscar García

Los integrantes recibimos


comentarios por parte de los
representantes de RENIEC

Se presentará los resultados obtenidos


Oscar García después de analizar el problema

Se implementará una nueva


versión del modelo
COMENTARIOS Modelo verificado

Oscar García

La nueva versión del modelo fue


aprobada y verificada para ser
implementado en la RENIEC

Oscar García

47
- ELABORACIÓN DEL GANTT

47
Modelo y Evaluación

En esta etapa del trabajo se utilizará datos previamente listos para generar nuestro

modelo de acuerdo con el enfoque analítico que hemos definido en este caso es descriptivo

diagnóstico. La construcción del modelo se realizará utilizando datos existentes y así poder

identificar qué es lo que está sucediendo sobre la problemática, y finalmente, se realizaran

pruebas para evaluar el modelo construido y comprobar si resuelve la problemática antes

definida.

Propuesta del modelo de ciencia de datos

La propuesta para presentar el modelo de ciencia de datos es el enfoque

descriptivo, dicho este modelo se aplicará cumpliendo al inicio desde el enfoque

diagnóstico y así, poder responder la pregunta principal de la investigación del trabajo,

para el enfoque que se propondrán se utilizara distintos datos abiertos, principalmente

Registro Nacional de Identificación y Estado Civil-RENIEC, por el cual esto ayudara a poder

justificar la presente investigación con el hecho de poder responder la pregunta principal y

las secundarias. En este sentido, nos enfocaremos en recopilar las siguientes variables.

1. Cuál es el departamento que tiene mayor cantidad de documentos de identidad no

tramitado, en comunidades nativas.

2. Identificar la cantidad de peruanos y peruanas que emitieron sus documentos en el primer

trimestre del 2022.

3. Identifique el tipo de tramite realizado por las zonas nativas del Perú según cantidad de

documentos no emitidos

4. Cuáles son los tramites más demandados que se realiza en la Reniec.

47
5. Hallar la cantidad con mayores solicitudes de DNI no entregados según comunidades

nativas del Perú 2022.

Visualizaciones:

Para mostrar las visualizaciones del siguiente trabajo usaremos la herramienta de Power

Bi, la cual nos facilitara crear los cuadros de cincos puntos importante que va de acuerdo con

nuestro proyecto elegido.

1.- A continuación, se muestra la cantidad de DNI no tramitados en Registro Nacional de

Identificación y Estado Civil (RENIEC), de los distintos departamentos nativos.

Fuente: Elaboración propia.

En el grafico se muestra que el departamento de Junín tiene mayor cantidad de documentos que

no han sido tramitados en el debido momento, por distintos motivos ya sea por perdida,

vencimiento, falta de tiempo, descuido o falta de recursos económicos. De tal manera que a la

fecha existen 746,008 Documentos que no se han tramitado.

2.- Cantidad total de documentos emitidos en los tres primeros meses del 2022, según su género.
47
Fuente: Elaboración propia, 2022

Según los gráficos podemos observar que en el mes de marzo del 2022 se emitió mayor

cantidad de documentos (DNI), de los cuales la mayor cantidad de trámites son de generó

masculino, con un aproximado de 11,000 personas. Esto se debe porque había muchas

citas sin atender en tiempos de pandemia.

3.- Aquí mostraremos cuales son los tramites de los documentos no emitidos con mayor

cantidad.

Fuente: Elaboración propia, 2022

47
Podemos observar que el departamento que tiene mayor tipo de solicitud es Cusco realiza

más inscripciones por primera vez, después sigue el duplicado en Junín, estas son los tramites que

se realiza con mayor frecuencia en Reniec.

4.- Cuáles son los tipos de trámite realizados en la Reniec, según cantidad de trámites con

mayor demanda.

Fuente: Elaboración propia, 2022

Podemos observar que los tramites con mayor demanda son la renovación y rectificación en

hombres y mujeres y, en segundo lugar, está la inscripción por primera vez, pues hoy en día es

indispensable tener el DNI vigente para realizar distintos trámites, ya sea en instituciones públicas

y privadas. La cual es una manera de incentivar a los ciudadanos a sacar su documento e

identidad.

47
5.- Hallar la cantidad con DNI no entregados según zona nativa, Perú, 2022.

Fuente: Elaboración propia, 2022

En el grafico podemos observar que el departamento de Cusco tiene mayor cantidad de

personas a quienes no se le ha entregado su DNI, Esto se puede dar posiblemente por falta de

tiempo de ir a realizar el trámite de recojo. De tal manera que a la fecha existen 734,997 personas

que ya tramitaron su DNI pero que aún permanece custodiado por RENIEC.

Los resultados que se presentaran a las partes interesadas se relacionan directamente con

la pregunta principal y secundarias especificando los resultados para cada enfoque establecido,

hasta llegar al descriptivo, donde se hallaran cuales con las cantidades de documentos de

identificación no realizadas por zonas nativas, numero de documentos emitidos y la cantidad de

tipos de trámites realizados con el propósito de determinar, que departamento tiene mayor de

documentos tramitados, para así, poder concluir con posibles concusiones.

47
- ANÁLISIS DEL CONJUNTO DE DATOS Y DASHBOARD DEL PROYECTO

a) Análisis del conjunto de datos utilizando Python:

Dentro del análisis que se utilizó en la data de Registro Nacional de Identificación

(RENIEC), en ella se encontró los tipos de DNI (tramitado y NO tramitado), el cual se enfoca

nuestro proyecto, según departamentos dentro de las comunidades nativas existen pobladores que

no han realizado el trámite de su DNI.

En la tabla 3 se puede observar uno de los departamentos de Amazonas provincia de

Chachapoyas según tabla adjunta se observa los DNI no tramitados dentro de las comunidades

nativas de paisa, Mama yaqué entre otros, donde se observa la cantidad de DNI no tramitados según

tipo de trámite “Renovación y rectificación”

Tabla 3 Estructura y primea 5 filas del datagrama

Fuente: elaboración propia, 2022

47
Tabla 4 Información general del dataframe

Elaboración Propia, 2022

En la siguiente tabla 4 se evidencia la cantidad de comunidades nativas que tenemos dentro

del territorio peruano, se encuentra los DNI no tramitado del departamento de Ucayali, provincia

Purús, las edades oscilan de 80 a 92 años, sexo mujer.

Tabla 5 Elaboración de estructura 5 filas del dataframe

Fuente: elaboración propia, 2022

En la tabla 5, se evidencia la información general del dataframe, donde se visualiza las

columnas que hay dentro de nuestra base de datos, como Departamento, provincia, distrito, edad,

47
tipo de DNI, sexo, tipo de trámite, cantidad de DNI, nombre de las comunidades. Con los datos

expuestos hallamos la cantidad de DNI no tramitados en las comunidades nativas del Perú.

b) Resumen descriptivo:

Los puntos más importantes que se detallan en la base de datos es el UBIGEO_INEI, EDAD,

CANTIDAD de población, es por ello por lo que, dentro de la estructura analizada mediante el

Colab, nos muestra datos estadísticos según detalle:

Tabla 6 Estadístico descriptivo

Elaboración propia,2022

47
c) Gráficos Colab en base a Python:

Ilustración 11 Tipo de DNI

Fuente: elaboración de datos, 2022

Elaboración propia, 2022

47
En el siguiente grafico encontramos los DNI no tramitado y DNI entregados, lo cual señala en el

gráfico adjunto que los muchos de las comunidades nativas no han tramitado su DNI dentro de los

centros de la organización RENIEC.

Ilustración 12 Referencia Sexo

Fuente: elaboración de datos, 2022

47
Ilustración 13 Referencia Edad

Fuente: elaboración de datos, 2022

47
- CONCLUSIONES

 Podemos concluir que el modelo funciona y que los datos obtenidos en el problema

demuestran que existe población de comunidades nativas que no han tramitado su

Documento Nacional de Identidad, por lo que el número tiende a tener una curva

ascendente y que existe problemas en todo el trámite en distintas partes de nuestro

país.

 El modelo sustenta que el departamento de Cusco es el que mayor número de

personas que tienen pendiente la tramitación de su Documento Nacional de

Identidad, por lo que se puede asumir que es el departamento que por su

infraestructura y lejanía de pueblos nativos tiene mayor dificultad de acceso a la

tramitación de documento de identidad, es por ello se recomienda a la Reniec poder

aumentar sus esfuerzos para lograr llegar a las partes más inaccesibles y poder

brindar el servicio como corresponde a todos los ciudadanos de dicho departamento,

para con ello lograr mayores accesos a programas sociales y de elección de

representante que llevara a mejoras significativas en las comunidades.

 La mayor cantidad de tramites de los DNI son personas del género masculino, por

lo que se puede asumir varias razones que podremos detallar, ya que en las

comunidades nativas el machismo puede estar presente y el género femenino tiene

que mantener la postura de ama de casa y esta posición les impide generar o iniciar

el trámite del Documento Nacional de Identidad al ser para ellos un acto de menos

importancia que la crianza de familia o dar prioridad al hogar. El género masculino

en general en las comunidades nativas sale a realizar el trabajo y búsqueda de

dinero para el hogar y al ser comunidades de distancias importantes, la familia no

puede dejar de ser atendida y tener niños aumenta la dificultad de lograr tramitar

47
un documento, sin mencionar que tener el DNI a veces no le garantiza la atención

gratuita y el ingreso a programa sociales.

 Hemos secundado que los mayores tramites que se realizan en la Reniec son los

DNI con inscripciones por primera vez, lo que nos hace notar que solo el primer

documento nacional de Identidad es importante, ya que esto da identificación pero

los tramites adicionales como lo son el duplicado, rectificación o cualquier trámite

derivado no se le da la importancia debida para tener datos actualizados en todas

las regiones y comunidades Nativas.

 El Modelo demuestra que las comunidades Nativas tienen una tendencia de no

tramitación de documentos de identidad, aquí aparece Ucayali donde el porcentaje

más elevado de no tramitación de personas son adultos mayores, que si bien no

tienen obligación de tramitar el documento tendría que la Reniec determinar si es

por un tema de edad o de ubicación o facilidad de trámite de la institución.

 Podemos concluir que existe una problemática en los tramites en el Registro

Nacional de Identificación y Estado Civil, ya que en los distintos departamentos y

regiones de nuestro país y en específico en comunidades nativas existe un alto

índice de no tramitación de los documentos de identidad, por lo que se puede

asumir que no se le da la importancia suficiente o se le da el valor al uso o poder

que tiene el documento para hacer valer las leyes que brinda nuestra constitución,

por lo que la Reniec deberá reforzar en infraestructura sino también trabajar junto

con el estado para dar mayor fuerza y promover una educación Cívica para

demostrar que el documento tiene una finalidad y un uso que da muchos derechos

a los ciudadanos para empezar a tener una vida digna y poder con ello tener

47
esperanza de que los futuros de nuestras comunidades nativas se integren a las

tecnologías que hoy en día se tiene acceso de manera mundial.

47
- REFERENCIA

Reniec. (s.f.). Registro Nacional de Identificación y Estado Civil. Obtenido de Reniec:


https://www.reniec.gob.pe/portal/tramiteGeneralA.htm.

Registro Nacional de Identificación de Estado Civil. (2022, 24 agosto).


https://www.reniec.gob.pe/portal/institucional.htm. Recuperado 25 de agosto de 2022, de
https://www.reniec.gob.pe/portal/institucional.htm.

Ivon, H. D. (2022). El Registro de Nacimiento y la Data Digital. Gestión en el tercer milenio, 25(49),

153-156. Obtenido de

https://revistasinvestigacion.unmsm.edu.pe/index.php/administrativas/article/view/23064/18

181

Colaborate (2022, 25 septiembre). Presentación de Python realizado en base de datos.

https://colab.research.google.com/drive/11qdruyLWFl-

BrxlH3mkidBb2tdO7DB5l?usp=sharing

48

También podría gustarte