Está en la página 1de 32

1

UNIVERSIDAD …………………..
FACULTAD DE INGENIERÍA DE SISTEMAS
ESCUELA PROFESIONAL DE INGENIERÍA DE
SISTEMAS

PROYECTO DE TESIS
REDES NEURONALES ARTIFICIALES Y EL ALGORITMO
HILL CLIMBING PARA LA PREDICCIÓN MULTI-STEP DE
LA RECAUDACIÓN TRIBUTARIA DEL PERÚ

PRESENTADO POR:
MENDOZA …. CARMEN
PARA OPTAR EL TÍTULO PROFESIONAL DE
INGENIERO DE SISTEMAS
ASESOR:
ING. RODOLFO ARPASI CHURA
JULIACA, PERÚ
2021
2

TABLA DE CONTENIDO
Índice general

Índice de tablas

1.1. DESCRIPCIÓN DEL PROBLEMA...................................................................5

1.2. FORMULACIÓN DEL PROBLEMA................................................................6

1.2.1. PROBLEMA GENERAL...............................................................................6

1.2.2. PROBLEMAS ESPECÍFICOS.......................................................................6

1.3. ANTECEDENTES.............................................................................................7

1.3.1. Nivel internacional.........................................................................................7

1.3.2. Nivel nacional................................................................................................7

1.4. JUSTIFICACIÓN DE LA INVESTIGACIÓN...................................................9

1.5. OBJETIVOS....................................................................................................12

1.5.1. OBJETIVO GENERAL...........................................................................12

1.5.2. OBJETIVOS ESPECÍFICOS...................................................................12

1.6. HIPÓTESIS......................................................................................................13

1.6.1. HIPOTESIS GENERAL..............................................................................13

1.6.2. HIPÓTESIS SECUNDARIAS.....................................................................13

2. BASES TEÓRICAS.................................................................................................14

2.1. MARCO TEÓRICO.........................................................................................14

2.1.1. REDES NEURONALES ARTIFICIALES (RNA).......................................14

3. MÉTODO................................................................................................................15

3.1. TIPO DE INVESTIGACIÓN...............................................................................15

NIVEL DE INVESTIGACIÓN........................................................................................15

DISEÑO DE LA INVESTIGACIÓN...............................................................................15

3.2. POBLACIÓN Y MUESTRA...............................................................................16

3.2.1. POBLACIÓN...................................................................................................16

3.2.2. TAMAÑO DE LA MUESTRA........................................................................16


3

3.3. OPERACIONALIZACIÓN DE VARIABLES....................................................16

3.3.1. DESCRIPCIÓN CONCEPTUAL DE VARIABLES.......................................16

3.3.1.1. VARIABLES DE HIPÓTESIS GENERAL.................................................16

3.4. INSTRUMENTOS, TÉCNICAS DE INVESTIGACIÓN....................................18

3.4.1. INSTRUMENTOS...........................................................................................18

3.4.2. TÉCNICAS......................................................................................................18

3.5. ANÁLISIS DE DATOS.......................................................................................18

3.5.1. TÉCNICAS DE RECOLECCIÓN DE DATOS...............................................18

3.5.2. TÉCNICAS PARA EL PROCESAMIENTO Y ANÁLISIS DE DATOS........19

3.5.3. TÉCNICAS DE ANÁLISIS E INTERPRETACIÓN DE LA INFORMACIÓN


19

3.5.4. DISEÑO ESTADÍSTICO.................................................................................20

4. ASPECTOS ADMINISTRATIVOS........................................................................21

4.1. CRONOGRAMA DE ACTIVIDADES...............................................................21

4.2. PRESUPUESTO DE LA INVESTIGACIÓN......................................................22

4.3. FUENTES DE FINANCIAMIENTO...................................................................23

5. REFERENCIAS BIBLIOGRÁFICAS.....................................................................24

6. ANEXOS.................................................................................................................30

6.1. ANEXO 1 MATRIZ DE CONSISTENCIA.........................................................30


4

INTRODUCCIÓN
“La proyección de los ingresos tributarios es una de las tareas más importantes
que lleva a cabo una oficina de estimaciones tributarias. Esa importancia
deviene del carácter esencial que tienen esas estimaciones para la
programación de la política fiscal, ya que la obtención de los más habituales
objetivos de la gestión fiscal -los resultados primario y financiero y el nivel de
endeudamiento- están inevitablemente ligados a las previsiones que se
efectúen para los diversos rubros de los ingresos y, en particular, debido a su
magnitud, para los de carácter tributario. El conocimiento del futuro es, por
diversas razones, una preocupación habitual de los seres humanos desde el
inicio de los tiempos. Esta preocupación ha dado lugar al desarrollo de
innumerables técnicas que, con muy diverso grado de sustento científico,
intentan descifrar el porvenir. En el campo económico, al menos, una revisión
de la amplísima literatura existente sobre este tema deja claramente sentado
que nuestra capacidad para conocer el futuro es ciertamente limitada” (Martín,
2009, pp. 29, 30).

El pronóstico de recaudación tributaria en el Perú es importante para la


planificación económica, ante ésta situación, la implementación de las Redes
Neuronales Artificiales con el algoritmo Hill Climbing permitirá una
proyección de importancia y muy significativa a la realidad a un costo menor
y que pueda servir de insumo proyectivo para las autoridades del gobierno
peruano.
5

1. DESCRIPCIÓN DEL PROBLEMA


El tema de investigación son las Redes Neuronales Artificiales y el algoritmo
Hill Climbing como parte de la línea de investigación de Inteligencia Artificial
tema que aún incipiente en el Perú, a su vez, pueda servir de insumo
académico para los estudiantes de pre y posgrado, el resultado del trabajo de
investigación será de importancia para la toma de decisiones de los agentes
económico – financieros del Estado peruano, estudiantes e investigadores.
La economía nacional demanda al Estado peruano mayor precisión en las
predicciones presupuestales requeridos por las carteras ministeriales y que
pueda atenderse esa demanda con solvencia, frente a esta situación el Perú a
través de la Superintendencia Nacional de Aduanas y de Administración
Tributaria (SUNAT) recauda ingresos tributarios provenientes del Impuesto a
la Renta, Producción y Consumo, otros Ingresos en millones de soles por año.
El ámbito de investigación comprende predecir los Ingresos Recaudados por
la SUNAT año 2019 totales (I+II +III+IV), considerando datos históricos de
recaudación de los años 2000 a 2018 en cuanto a: I. Ingresos Tributarios
Recaudados por la SUNAT – internos (impuesto a la renta, impuesto a la
producción y consumo, otros ingresos); II. Ingresos Tributarios Recaudados
por la SUNAT – aduaneros (impuestos a la importación, impuesto general a
las ventas, impuesto selectivo al consumo); III. Contribuciones sociales
(contribuciones al seguro social de salud, contribuciones al sistema nacional
de pensiones contribución solidaria para la asistencia previsional); IV.
Ingresos no Tributarios (regalías mineras, regalías Ley 29789, gravamen
especial a la minería).
Para predecir las recaudaciones tributarias se propone proyectar un algoritmo
basado en una Red Neuronal Artificial Multilayer Perceptrón y el algoritmo
Hill Climbing para la predicción multi-step de la recaudación de impuestos.
El aporte del trabajo de investigación se centra en las predicciones acertadas
con un mínimo margen de error de la captación real lo cual permitirá
planificar adecuadamente los programas de gasto del Estado peruano, su
estabilidad económica, promoción del desarrollo entre otros.
6

2. FORMULACIÓN DEL PROBLEMA


1. PROBLEMA GENERAL
¿Con el desarrollo de la Red Neuronal Artificial y el Algoritmo Hill
Climbing se hallará mejores resultados en las predicciones multi-step
de la recaudación tributaria del Estado peruano 2019?

2. PROBLEMAS ESPECÍFICOS
1. ¿Con el diseño de un modelo basado en una Red Neuronal
Artificial y el algorítmico Hill Climbing permitirá perfeccionar
los resultados predictivos multi-step de series temporales de
recaudación tributaria?
2. ¿Con la implementación del modelo basado en una Red
Neuronal Artificial y el algorítmico Hill Climbing optimizará
los resultados predictivos multi-step de series temporales de
recaudación tributaria?
3. ¿La evaluación del modelo basado en Red Neuronal Artificial y
el Algoritmo Hill Climbing en contraste con la serie temporal
de la recaudación tributaria del Estado peruano 2019 permitirá
validar el algoritmo de la red?
7

3. ANTECEDENTES
1. Nivel internacional (FORMATO: PREGUNTA, OBJETIVOS,
MÉTODOS, CONCLUSIONES, EN UN PÁRRAFO)

Sisnando (2000), utilizó una “red neuronal del tipo Multilayer Perceptrón
(MLP) de 190 neuronas de entrada, 06 neuronas en la capa oculta y 01
neurona en la capa de salida, para previsión y evaluación de desempeño
de los contribuyentes del ICMS del Estado de Ceará. Su estudio concluye
que el modelo de red neural posibilita resultado bastante superior al
esperado.
Freitas y Souza (2002) utilizaron una red Multilayer Perceptrón (MLP)
con una capa intermedia, cuatro neuronas y una capa de salida con sólo
una neurona, para verificar si el modelo de precios de opciones en el
mercado financiero basado en las técnicas de redes neuronales es capaz de
superar el método de Black y Sholes (1973) en la determinación de los
precios de las opciones. Los pesos iniciales, representativos del proceso
de síntesis, fueron definidos al azar por el propio software. Las tasas de
aprendizaje (η) y el impulso (α) se mantuvieron constantes,
respectivamente a 0,6 y 0,8, parámetros sugeridos por la aplicación,
después de definir la topología de ARN. El error promedio máximo se
estableció en 2%. Para la validación, se usó un porcentaje del 95% del
subconjunto como criterio de detención del ARN, y puede haber una
variación de hasta el 48% de la tasa de error máxima definida, se adoptó
el criterio de validación “por ciclo”, siendo efectivo cada 5 ciclos”.

Ramos y otros (2009), desarrollaron herramientas informáticas


inteligentes basadas en redes neuronales artificiales para identificar las
pérdidas comerciales o fraudes (robo de energía), información proveída
de la base de datos de una concesionaria de energía eléctrica.

2. Nivel nacional
8

Vega (2011), en la Universidad Nacional Federico Villareal, desarrolla


Sistema Experto que permite reconocer los mangos cuyas formas
cumplen con los estándares de calidad exigidos por clientes de Estados
Unidos y Europa, el software está basado en el proceso de imágenes
digitales de mangos mediante redes neuronales artificiales, para éste
efecto toma una imagen digital de cada producto, con dichas imágenes
entrena una Red Neuronal para que reconozca acertadamente todos los
elementos de la muestra, luego, realizar pruebas de reconocimiento con
otros mangos de calidad, concluye que el software reconoce
acertadamente.

Coayla (2007), presenta su investigación respecto a la incidencia del uso


de Redes Neuronales Artificiales en la calificación de bonos
desarrollando un modelo adecuado para la optimización del proceso de
calificación de los bonos en el mercado de valores peruano. El modelo se
basa en mapas auto organizados, el resultado le permite optimizar la
clasificación con un diseño de 5 clases o categorías, validando la hipótesis
de estudio.
9

4. JUSTIFICACIÓN DE LA INVESTIGACIÓN
GESTIÓN GUBERNAMENTAL:
El Planeamiento Estratégico Institucional 2017-2019 de la
Superintendencia Nacional de Aduanas y de Administración Tributaria
(SUNAT) en su Objetivo Estratégico Sectorial (OES3) plantea, “Alcanzar
una mayor recaudación de Ingresos Fiscales” y en su Objetivo
Estratégico Institucional (OE1) plantea “Mejorar el cumplimiento
tributario y aduanero” a través de sus mecanismos de control contribuye
a mejorar el cumplimiento tributario y por ende alcanzar una mayor
recaudación de los ingresos fiscales.
La baja formalidad de la economía peruana es una de las principales
restricciones para el crecimiento económico de largo plazo.
Los ingresos totales recaudados por la SUNAT en el 2017 ascendieron a S/
122 768 millones. Estos ingresos están compuestos por los Ingresos
Tributarios del Gobierno Central, las Contribuciones Sociales y los
Ingresos No Tributarios. Los Ingresos Tributarios del Gobierno Central,
sin descontar devoluciones, ascendieron en el 2017 a S/ 107 915 millones
monto que significó una disminución de 0,7% en términos reales; mientras
que las Contribuciones Sociales ascendieron a S/ 13,713 millones y
experimentaron un crecimiento real de 0,8%. Asimismo, los Ingresos No
Tributarios recaudados por la SUNAT totalizaron S/ 1 140 millones y
registraron un crecimiento real de 33,7%. Cabe señalar que, si se
descuentan las devoluciones de impuestos, los ingresos tributarios
totalizaron S/ 90 706 millones en el 2017, lo cual significó una
disminución de 1,3% en términos reales.
Las proyecciones iniciales de desempeño de la actividad económica en el
2017 contemplaron un crecimiento del PBI mundial de 3,5%, PBI nacional
de 3,0% y una demanda interna de 1,9%. Sin embargo, al cierre 2017 si
bien la economía mundial, según cifras preliminares, creció 3,7%; la
economía nacional lo hizo sólo en 2,5%; mientras que la demanda interna
alcanzó tan solo un 1,2%; ello con un PBI que ha sido sostenido
principalmente por el componente de exportaciones más que por el aporte
10

de la demanda interna, ya que la inversión privada tuvo crecimiento nulo,


mientras que la inversión pública tuvo un crecimiento por debajo de las
altas tasas proyectadas.
En relación con el desempeño de la recaudación, a continuación, se explica
con mayor detalle el comportamiento de los ingresos tributarios
recaudados por la SUNAT. Al respecto, cabe mencionar que los Ingresos
del Gobierno Central representan en promedio 97,4% del total de ingresos
tributarios del Gobierno General, mientras que el 2,6% restante
corresponde a los gobiernos locales.
En relación a los principales componentes de los ingresos tributarios del
Gobierno Central, los tributos internos alcanzaron S/ 81 224 millones,
registrando una disminución de 1,7%; por su parte, los tributos aduaneros
generaron S/ 26,690 millones, significando un aumento de 2,3%; y, las
devoluciones de impuestos aumentaron 2,3%.
Asimismo, respecto del comportamiento de los principales tributos, el IGV
total recaudado en 2017 sumó S/ 54,643 millones y registró un crecimiento
de 0,9%; mientras que el Impuesto a la Renta totalizó S/ 36,755 millones y
experimentó una disminución real de 4,0%. Cabe mencionar que estos 2
tributos explican en conjunto alrededor del 90% de los ingresos tributarios
totales.
Con relación a los principales factores que explicaron la disminución de
los ingresos tributarios en el año 2017, se pueden mencionar los
siguientes:
 La menor actividad económica (sobre todo en lo que respecta a los
componentes de Demanda Interna e Inversión);
 Los efectos del Fenómeno Niño Costero con las consecuentes
declaraciones de emergencia y postergaciones en la declaración y pago
de impuestos;
 El impacto de los casos de corrupción asociado a empresas brasileras
sobre la actividad económica, en particular sobre el sector
construcción;
11

 El menor flujo de ingresos tributarios extraordinarios con relación a los


obtenidos en 2016; principalmente por un conjunto de operaciones de
venta de acciones de empresas representativas;
 Las mayores devoluciones de impuestos por concepto de exportación y
pago en exceso y/o indebido, principalmente en los sectores minería e
hidrocarburos;
 El efecto de algunas medidas tributarias implementadas a lo largo del
año 2017 como es el caso del diferimiento del pago del IGV y el nuevo
régimen del Impuesto a la Renta para MYPES; y
 Las barreras estructurales que se mantienen en la economía y hacen
más compleja la lucha contra la informalidad y el incumplimiento
tributario por parte de la Administración Tributaria. Entre estas, cabe
mencionar al secreto bancario, los bajos niveles de intermediación
financiera y el diseño de la normatividad en materia laboral.
Ante este contexto, consideramos que es muy importante contar con una
Administración Tributaria fuerte, que disponga de los recursos necesarios
para su permanente modernización orientada a la eficacia. (SUNAT, 2017)

INVESTIGACIÓN:
Las Redes Neurales representan una línea de investigación muy poco
desarrollado en el país, consecuentemente, es una oportunidad que
presenta la Escuela Universitaria de Posgrado a sus egresados de
desarrollar ésta línea de investigación.
Evaluar la capacidad de las redes neuronales en la predicción de series
temporales es de sumo interés, que pronostique valores futuros de la
recaudación tributaria peruana y que permita mostrar su precisión respecto
a técnicas estadísticas.

TECNOLÓGICA:
Las Redes Neurales tienen múltiples aplicaciones a diversas áreas del
conocimiento: salud, ingeniería, educación, gestión gubernamental,
productos tecnológicos como dispositivos electrónicos: celulares,
12

domótica, equipos médicos, etc., tecnología que acompañará a la


humanidad en los siguientes siglos.

5. OBJETIVOS
1. OBJETIVO GENERAL
Proyectar una Red Neuronal Artificial y el Algoritmo Hill Climbing
que calcule los mejores resultados en las predicciones multi-step de la
recaudación tributaria del Estado peruano 2019.

2. OBJETIVOS ESPECÍFICOS
1. Diseñar un modelo basado en Red Neuronal Artificial y el
Algoritmo Hill Climbing para la predicción multi-step de la
recaudación tributaria del Estado peruano 2019.
2. Implementar un modelo basado en Red Neuronal Artificial y el
Algoritmo Hill Climbing para la predicción multi-step de la
recaudación tributaria del Estado peruano 2019.
3. Evaluar el modelo basado en Red Neuronal Artificial y el
Algoritmo Hill Climbing con la serie temporal de la
recaudación tributaria del Estado peruano 2019.
13

6. HIPÓTESIS
1. HIPOTESIS GENERAL
Si se implementa el modelo de la Red Neuronal Artificial y el
Algorítmico Hill Climbing entonces posibilita hallar mejores
resultados en la predicción multi-step de la recaudación tributaria del
Estado peruano 2019.

2. HIPÓTESIS SECUNDARIAS
1. Si se diseña el modelo basado en una Red Neuronal Artificial y
el Algoritmo Hill Climbing entonces se perfecciona
notablemente los resultados predictivos multi-step de series
temporales de recaudación tributaria.
2. Si se implementa el modelo de Red Neuronal Artificial y el
Algoritmo Hill Climbing entonces se optimiza
significativamente los resultados predictivos multi-step de
series temporales de recaudación tributaria.
3. Si se evalúa la Red Neuronal Artificial y el Algoritmo Hill
Climbing en relación a la serie temporal de recaudación
tributaria del Estado peruano 2019 entonces se comprueba la
predicción significativa de recaudación.
14

2. BASES TEÓRICAS
1. MARCO TEÓRICO
1. REDES NEURONALES ARTIFICIALES (RNA)
“Las RNA aplicadas están inspiradas en las redes neuronales biológicas,
aunque poseen otras funcionalidades y estructuras de conexión distintas a
las vistas desde la perspectiva biológica. Las características principales de
las RNA son las siguientes: 1. Auto-Organización y Adaptabilidad:
utilizan algoritmos de aprendizaje adaptativo y auto-organización, por lo
que ofrecen mejores posibilidades de procesado robusto y adaptativo. 2.
Procesado no Lineal: aumenta la capacidad de la red para aproximar
funciones, clasificar patrones y aumenta su inmunidad frente al ruido. 3.
Procesado Paralelo: normalmente se usa un gran número de nodos de
procesado, con alto nivel de interconectividad.

El elemento básico de computación (modelo de neurona) es un nodo o


unidad.
15

3. MÉTODO
1. TIPO DE INVESTIGACIÓN
 La investigación es de tipo aplicada de acuerdo a la orientación, ya que
se enfoca en resolver un problema real aplicando un modelo inteligente
predictivo de redes neuronales.
 De acuerdo a la técnica de contrastación, la investigación es
explicativa, puesto que se trata de encontrar las causas del problema y
su análisis respectivo.
 La investigación será prospectiva de acuerdo a la direccionalidad,
considerando que la investigación estudiará un fenómeno cuya causa
es en el presente y el efecto será en el futuro, describiendo los eventos
que ocurrirán.
 De acuerdo con el tipo de fuente de recolección de datos, la
investigación es retrospectiva ya que la información se analizará de los
archivos publicados por la SUNAT desde el año 2000 a 2018 con los
criterios propios y para fines específicos.
 La investigación es longitudinal de acuerdo a la evolución del
fenómeno estudiado, puesto que las variables se medirán en varios
estadios y comportamientos al que serán expuestos.

NIVEL DE INVESTIGACIÓN
La investigación es de nivel IV, de tipo predictivo II, en consideración al
modelo matemático aplicado en el diseño de la red neuronal y la
proyección de una estimación probable que puede ser solo de
comportamiento o cambio total, por medio del análisis de la hipótesis y
basado en la estadística.

DISEÑO DE LA INVESTIGACIÓN
El diseño de la investigación es experimental, en la que se tomará en
cuenta la homogeneidad, aleatoriedad y representatividad de los datos de
la muestra.
16

2. POBLACIÓN Y MUESTRA
1. POBLACIÓN
La población está conformada por toda la información reportada por la
SUNAT desde el año 2000 a 2018, respecto de los ingresos recaudados en
millones de soles anual/mensual.

2. TAMAÑO DE LA MUESTRA
El método a usar para el muestreo en la investigación es no probabilístico,
de tipo Intencional o deliberado, los elementos que integrarán la muestra
serán todos los elementos de la población.

3. OPERACIONALIZACIÓN DE VARIABLES
Hacer en un cuadro
1. DESCRIPCIÓN CONCEPTUAL DE VARIABLES
1. VARIABLES DE HIPÓTESIS GENERAL
 RED NEURONAL ARTIFICIAL.
“Las Redes Neuronales Artificiales (RNA) son sistemas de
cálculo que se parecen a las redes neuronales biológicas al
utilizar nodos (neuronas) interconectados. Estos nodos
recogen la información, sobre los datos realizan
operaciones y transmiten sus resultados a otros nodos. La
estrategia consiste en entrenar a las RNA para que aprendan
patrones complejos de relaciones entre las variables
predictoras y obtengan resultados capaces de enfrentarse a
nuevos datos dando las respuestas esperadas, también se
especifican como sistemas no lineales, flexibles y con gran
capacidad de generalización, éstas propiedades han hecho
que se difundieran en todos los campos científicos” en
(Trujillano et al., 2003, p. 505).

 PREDICCIÓN MULTI-STEP
17

“En predicción multi-step, los valores previstos son


agregados a la base de datos de entrada y utiliza estos
valores para predecir valores futuros” en (Mamani Ticona
et al., 2017, p. 80).

La variable Redes Neuronales Artificiales y algoritmo


Hill Climbing, se evaluará a través de las dimensiones
Diseño, Implementación, Evaluación; considerando los
indicadores Arquitectura de red neuronal, Entradas de la
red neuronal, Identificación de los mejores parámetros de la
red neuronal, Teste – Multi-step.

La variable Predicción multi-step de series temporales de


recaudación tributaria, se evaluará a través de las
dimensiones: Ingresos tributarios recaudados por SUNAT,
Proyección de tendencia, Estacionalidad y tendencia,
considerando los indicadores: internos, aduaneros,
contribuciones sociales, no tributarios; Regresión de
tendencia lineal, Suavizamiento exponencial lineal,
Regresión de tendencia no lineal; Estacionalidad sin
tendencia, Estacionalidad y tendencia, Modelo basado en
datos mensuales.
18

4. INSTRUMENTOS, TÉCNICAS DE INVESTIGACIÓN


1. INSTRUMENTOS
Para recopilar la información se utilizará la ficha matricial de indicadores
de doble entrada: ingresos recaudados en millones de soles
(mensual/anual) versus conceptos de recaudación (internos, aduaneros,
sociales, no tributarios) anexo 3 Datos de entrenamiento de la red neural.

2. TÉCNICAS
 Arquitectura Multilayer Perceptrón
 Predicción de series temporales
 Aprendizaje supervisado
 Para revisión de código
o Técnica estática: análisis y chequeo de documentos de
requisitos, diagramas de diseño, código fuente, etc.
o Dinámicas: pruebas sobre implementación real (en código
ejecutable).

5. ANÁLISIS DE DATOS
1. TÉCNICAS DE RECOLECCIÓN DE DATOS
Para recopilar la información se utilizará el proceso de ETL (Extracción,
Transformación, Cargado) que es una parte de la integración de datos.
Extracción: extraer los datos desde los sistemas de origen (SUNAT),
analizar los datos extraídos obteniendo un chequeo (matriz de doble
entrada), interpretación de información para verificar que los datos
extraídos cumplen con los requerimientos de investigación.
Transformación: son datos extraídos para convertirlos en datos que serán
cargados.
Proceso de carga: los datos procedentes de la fase anterior son cargados en
el sistema de destino (RNA).
19

2. TÉCNICAS PARA EL PROCESAMIENTO Y ANÁLISIS DE


DATOS
Para el procesamiento y análisis de datos se utilizará dos técnicas, la
descriptiva y la predictiva.
Para la descriptiva se utilizará la herramienta de Microsoft Power BI
(Business Inteligence) para estudiar el comportamiento histórico de las
recaudaciones tributarias.
Para la predictiva se utilizará los modelos estadísticos de proyección que
permiten obtener información de la cantidad de recaudaciones futuras que
necesitará el Estado.

3. TÉCNICAS DE ANÁLISIS E INTERPRETACIÓN DE LA


INFORMACIÓN
Para realizar el procesamiento y análisis de la información, se utilizará el
programa SPPS para el análisis de la información procesada, el estadístico
“Chi cuadrado” para demostrar la relación entre las variables de estudio, se
considerará lo siguiente:
 Evaluación de los resultados obtenidos en las pruebas del cluster
computacional.
 Análisis de los reportes presentados en los ensayos experimentales
en el cluster computacional.
 Elaboración de los instrumentos para medir la
funcionalidad del modelo computacional.
 Elaboración de los instrumentos para medir la precisión de los
resultados y estandarizar las características.
 Elaboración de los instrumentos para medir los datos de
información obtenida en las pruebas.
 Tabulación y elaboración de los resultados.
 Contrastación de la hipótesis.
20

4. DISEÑO ESTADÍSTICO
La prueba estadística para determinar las relaciones entre las variables
serán los estadísticos Chi cuadrado, T Student, para correlacionar validez y
significancia de la prueba de la Hipótesis planteada.
21

4. ASPECTOS ADMINISTRATIVOS
1. CRONOGRAMA DE ACTIVIDADES

ETAPAS ACTIVIDADES 2021


Julio Agosto Setiembre Octubre Noviembre Diciembre
1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
 Revisión del proyecto x x x x
 Revisión de la literatura x x x x x x x x x x x x x x x x x x x x x x x x x x x x
Planificación
 Revisión de los instrumentos x x x x
 Presentación del proyecto x x x x
 Preparación de recursos x x x x
Implementació  Coordinación institucional x x x x
n  Prueba piloto - prototipo x x x x
 Revisión y reproducción de instrumentos x x x x
 Recolección de datos x x x x
Ejecución  Procesamiento de datos x x x x
 Análisis e interpretación de resultados x x x x
 Redacción del informe final x x x x
Divulgación  Impresión del informe final y divulgación x x x x
de resultados
22

2. PRESUPUESTO DE LA INVESTIGACIÓN
 Recurso Humano:
Un especialista en estadística.
Un especialista en testeo de código computacional
Especialista en el manejo de Power BI
 Recurso Tecnológico
Paquete estadístico SPSS para validar los modelos estadísticos que se
ajustan a los datos de atención
Herramienta de inteligencia de negocios Power BI
Herramienta de testeo de código
Cluster computacional.
 Recurso Económico
Autofinanciado, gastos del personal de apoyo, el tratamiento de datos,
análisis y publicación de resultados.

UNIDAD DE VALOR CANTID SUB


COD DESCRIPCION MEDIDA UNITARIO AD TOTAL TOTAL
MATERIALES Y UTILES
1.00 DE ESCRITORIO         S/265,0
1.01 Papel Bond A4 75 gr millar 24 2 S/48,0  
1.02 Lapiceros de color azul unidad 1,5 50 S/75,0  
1.03 Plumones Gruesos de colores unidad 3 24 S/72,0  
1.04 Cinta Maskin tape 2" Unidad 3 12 S/36,0  
1.05 Fólder Manila A4 Unidad 0,5 20 S/10,0  
1.06 Cartulina de colores Unidad 1 12 S/12,0  
1.07 Papelografos cuadriculados Unidad 1 12 S/12,0  
3.00 SERVICIO DE IMPRESIÓN         S/600,0
SERVICIO DE
4.00 COMUNICACIÓN         S/4.550,0
4.01 Alquiler de internet Horas 1 200 S/200,0  
4.02 Comunicación telefónica Soles 150 1 S/150,0  
4.03 Transporte local - nacional Unidad 600 7 S/4.200,0  
SERVICIO
8.00 ESPECIALIZADO         S/5.800,0
8.01 Servicio de estadista Servicio 750 1 S/750,0  
8.02 Servicio de digitación Servicio 250 1 S/250,0  
8.03 Servicio de asesoría Servicio 4800 1 S/4.800,0  
TOTAL           S/11.215,0
23

3. FUENTES DE FINANCIAMIENTO
El presupuesto de S/11.215,0 serán asumidas en su integridad por el
investigador.
24

5. REFERENCIAS BIBLIOGRÁFICAS (USAR ESTILO APA – ZOTERO)

Aparicio de la Fuente, A., & Gonel, A. J. (2005). Estudio de los algoritmos de

mejora iterativa. Recuperado de

https://www.infor.uva.es/~calonso/IAI/TrabajoAlumnos/iterativos.pdf

Arnold, M., & Osorio, F. (1998). Introducción a los Conceptos Básicos de la

Teoría General de Sistemas.Cinta de Moebio, (3) 

Bakos, Y. & Treacy, M. (1986). Information technology and corporate strategy: A

research perspective. MIS Quarterly, 10, 107-119.

http://dx.doi.org/10.2307/249029

Burton, A. (1986) Teoría de sistemas, Universidad de California, Illinois

University

Cabero, J. (1998). Impacto de las nuevas tecnologías de la información y la

comunicación en las organizaciones educativas. En Lorenzo, M. y otros

(coords): Enfoques en la organización y dirección de instituciones

educativas formales y no formales (pp. 197-206). Granada: Grupo

Editorial Universitario.

Cadenas, H. (2012). El sistema de la estructura: Estructuralismo y teoría de

sistemas sociales. Cinta de moebio, (45), 204-

214. https://dx.doi.org/10.4067/S0717-554X2012000300002

Castro, M. C. F. de. (2001). Predição Não-Linear de Séries Temporais Usando

Redes Neurais RBF por Decomposição em Componentes Principais (Tese

de Doutorado, Universidade Estadual de Campinas - UNICAMP).

Recuperado de

http://repositorio.unicamp.br/jspui/handle/REPOSIP/260700
25

Cózar-Gutiérrez, R., De Moya-Martínez, M. V., Hernández-Bravo, J. A., &

Hernández-Bravo, J. R. (2016). Conocimiento y Uso de las Tecnologías de

la Información y las Comunicaciones (TIC) según el Estilo de Aprendizaje

de los Futuros Maestros. Formación universitaria, 9(6), 105-

118. https://dx.doi.org/10.4067/S0718-50062016000600010

Coayla, A. (2007). Aplicación de un modelo de redes neuronales artificiales para

calificación de bonos en el Perú. Tesis de doctorado. Universidad Nacional

Federico Villareal, Lima.

Díaz, M., de Liz Contreras, Y., & Rivero Amador, S. (2009). Características de

los sistemas de información que permiten la gestión oportuna de la

información y el conocimiento institucional. ACIMED, 20(5), 66-71.

Recuperado en 22 de junio de 2019, de http://scielo.sld.cu/scielo.php?

script=sci_arttext&pid=S1024-94352009001100006&lng=es&tlng=es.

Filali Bouami, M. (2005). Desarrollo y optimización de nuevos modelos de redes

neuronales basadas en funciones de base radial (Tesis doctoral,

Universidad de Granada). Recuperado de

https://hera.ugr.es/tesisugr/15472620.pdf

La Recaudación Tributaria. Aspectos Generales. (s. f.). Recuperado 18 de agosto

de 2019, de INEAF website: https://www.ineaf.es/divulgativo/sistema-

tributario/procedimientos-tributarios-regimen-sancionador/la-recaudacion-

tributaria-aspectos-generales

Maturana, H. (1984). El Árbol del Conocimiento: Las Bases Biológicas del

Entendimiento Humano. Chile. Ed. Universitaria.


26

Mamani Ticona, W., Figueiredo Leite, K., & Rebuzzi Vellasco, M. (2017).

Predicción multi-step del impuesto sobre servicios usando redes

neuronales artificiales y métodos de sección de variables. Revista

Científica Andina - Science & Humanities, 1(1).

Marín Diazaraque, J. M. (2012). Introducción a las Redes Neuronales Aplicadas.

Recuperado de

http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/Expertos/Curso

NN12.pdf

Martín, F. (2009). La economía de los ingresos tributarios. Un manual de

estimaciones tributarias. Recuperado de

https://www.cepal.org/ilpes/noticias/paginas/5/39245/manual_62_FM.pdf

Morettin, P. A., & Toloi, C. M. de C. (1987). Previsão de series temporais. (2a

ed.). São Paulo: Atual.

Ocaña, F. M. (2017). Técnicas estadísticas en Nutrición y Salud. Tratamiento

estadístico de outliers y datos faltantes. Recuperado de

http://www.ugr.es/~fmocan/MATERIALES

%20DOCTORADO/Tratamiento%20de%20outliers%20y%20missing.pdf

Oliveira, Â. R. de. (2005). Redes neurais artificiais aplicadas na detecção,

classificação e localização de defeitos em linhas de transmissão (Tese

Mestre em Ciências, Universidade Federal de Juiz de Fora). Recuperado

de http://www.ufjf.br/ppee/files/2008/12/211047.pdf

Piedra, D. (2011). Definición de cibernética. ACIMED, 22(3), 271-281.

Recuperado en 22 de junio de 2019, de http://scielo.sld.cu/scielo.php?

script=sci_arttext&pid=S1024-94352011000300008&lng=es&tlng=es.
27

Rai, A., Patnayakuni, R., & Seth, N. (2006). Firm performance impacts of

digitally enabled supply chain integration capabilities. MIS Quarterly,

30(2), 225-246.

Ramos, C., Souza, A., Pereira, L., Gastaldello, D., Zago, M. & Papa, J. P. (2009).

Técnicas inteligentes aplicadas na identificação de consumidores

industriais fraudadores de energia elétrica. In: Latin-American Congress

On Electricity Generation And Transmission. Ubatuba. Anais. São Paulo:

UNESP, p. 281-286.

Santos, M. (2011). Un Enfoque Aplicado del Control Inteligente. Revista

Iberoamericana de Automática e Informática Industrial RIAI, 8(4), 283-

296. https://doi.org/10.1016/j.riai.2011.09.016

Sisnando, S. (2000). Previsão avaliação do desemoenho dos contribuintes do

ICMS do estado do Ceará utilizando as Redes Neurais Artificiais.

Dissertação (Mestrado em Administração de Empresas) – Universidade de

Fortaleza, Brasil.

SUNAT – Superintendencia Nacional de Aduanas y Administración Tributaria

(2017). Informe de Gestión por Resultados año 2017.

http://www.sunat.gob.pe/cuentassunat/planestrategico/informeGestion/info

rGestion-2017.pdf

Tapia, J. O. (2008). Aplicación de la Inteligencia Artificial en los Video

Juegos.RITS [online]. n.1 [citado 2019-06-22], pp. 60-63. Disponible en:

<http://www.revistasbolivianas.org.bo/scielo.php?

script=sci_arttext&pid=S1997-40442008000200016&lng=es&nrm=iso>.

ISSN 1997-4044.
28

Trujillano, J., March, J., Badia, M., Rodríguez, A., & Sorribas, A. (2003). Aplicación de las

redes neuronales artificiales para la estratificación de riesgo de mortalidad

hospitalaria. Gaceta Sanitaria, 17, 504-511. Recuperado de

http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0213-

91112003000600012Mamani Ticona, W., Figueiredo Leite, K., & Rebuzzi

Vellasco, M. (2017). Predicción multi-step del impuesto sobre servicios

usando redes neuronales artificiales y métodos de sección de variables.

Revista Científica Andina - Science & Humanities, 1(1).

Martín, F. (2009). La economía de los ingresos tributarios. Un manual de

estimaciones tributarias. Naciones Unidas, CEPAL [u.a.].

https://www.cepal.org/ilpes/noticias/paginas/5/39245/manual_62_FM.pdf

Trujillano, J., March, J., Badia, M., Rodríguez, A., & Sorribas, A. (2003).

Aplicación de las redes neuronales artificiales para la estratificación de

riesgo de mortalidad hospitalaria. Gaceta Sanitaria, 17, 504-511.

http://scielo.isciii.es/scielo.php?script=sci_arttext&pid=S0213-

91112003000600012

Vega, H. (2011). Redes neuronales para el reconocimiento de la calidad

morfológica de los mangos exportables para la empresa Biofruit del Perú

S.A.C. Tesis de doctorado. Universidad Nacional Federico Villareal,

Lima.

Velásquez, F. (2000). El enfoque de sistemas y de contingencias aplicado al

proceso administrativo. Estudios Gerenciales, 16(77), 27-40. Retrieved

June 22, 2019, from http://www.scielo.org.co/scielo.php?

script=sci_arttext&pid=S0123-59232000000400002&lng=en&tlng=es.
29

Visintín, V., & Baulies, C. (2001). Inteligencia fiscal a través de perfiles de riesgo

integrados para la selección de contribuyentes. CIAT/AEAT/IEF.

Ynzunza, C., & Izar, J. (2011). Efecto de las estrategias competitivas y los

recursos y capacidades orientados al mercado sobre el crecimiento de las

organizaciones. Contaduría y Administración, 58(1), 169-197

Zavaleta, E., & Rodríguez, E. (2010). Sistema de pronóstico de la demanda de

productos farmacéuticos basado en redes neuronales. Tesis de grado.

Universidad Nacional Mayor de San Marcos. Recuperado de

http://cybertesis.unmsm.edu.pe/bitstream/cybertesis/3222/1/Gil_ze.pdf.
30

6. ANEXOS
1. ANEXO 1 MATRIZ DE CONSISTENCIA
PREGUNTAS DE
OBJETIVOS HIPÓTESIS VARIABLES DIMENSIONES INDICADORES ÍNDICES INSTRUMENTO ESCALA
INVESTIGACIÓN
Arquitectura de  Multi-step 12
red neuronal pasos adelante
 Numero de
experimentos:
15
 Número de
generaciones:
12
Entradas de la red
 Número de
neuronal
individuos: 12
 Índice de
mutación: 0,05
Si se implementa el
Proyectar una Red  Porcentaje de
modelo de la Red
Neuronal Artificial reemplazo:
¿Con el desarrollo de la Neuronal Artificial y el Variable
y el Algoritmo Hill 0,25
Red Neuronal Artificial y el Algorítmico Hill independiente: Diseño
Climbing que  Número Múltiples series
Algoritmo Hill Climbing se Climbing entonces Redes
calcule los mejores máximo de temporales
hallará mejores resultados posibilita hallar mejores Neuronales Implementación
resultados en las repeticiones: (MAPE) Cuantitativa
en las predicciones multi- resultados en la Artificiales y
predicciones multi- 100
step de la recaudación predicción multi-step algoritmo Hill Evaluación
step de la  Número
tributaria del Estado de la recaudación Climbing .
recaudación Identificación de máximo de
peruano 2019? tributaria del Estado
tributaria del Estado los mejores fallas en el
peruano 2019.
peruano 2019. parámetros de la conjunto de
red neuronal. validación: 25
 Función de
activación en
capa oculta –
función
tansing.
 Cálculo de
teste: meses
 Calculo de
Teste – Multi-step
error relativo:
%
31

Si se diseña el modelo Internos


¿Con el diseño de un modelo Diseñar un modelo basado en una Red Aduaneros
basado en una Red Neuronal basado en Red Neuronal Artificial y el Contribuciones
Artificial y el algorítmico Neuronal Artificial y Algoritmo Hill Climbing sociales
Ingresos
Hill Climbing permitirá el Algoritmo Hill entonces se perfecciona
tributarios
perfeccionar los resultados Climbing para la notablemente los Millones de soles
recaudados por
predictivos multi-step de predicción multi-step resultados predictivos
SUNAT
series temporales de de la recaudación multi-step de series No tributarios
recaudación tributaria? tributaria del Estado temporales de
peruano 2019 recaudación tributaria.

Si se implementa el Regresión de
Implementar un
¿Con la implementación del modelo de Red Neuronal tendencia lineal
modelo basado en Red Variable
modelo basado en una Red Artificial y el Algoritmo Suavizamiento
Neuronal Artificial y dependiente:
Neuronal Artificial y el Hill Climbing entonces se exponencial lineal
el Algoritmo Hill Predicción multi-
algorítmico Hill Climbing optimiza
Climbing para la step de series Proyección de Validación de
optimizará los resultados significativamente los % Cuantitativa
predicción multi-step temporales de tendencia Modelos de
predictivos multi-step de resultados predictivos
de la recaudación recaudación Regresión de Pronósticos
series temporales de multi-step de series
tributaria del Estado tributaria. tendencia no lineal
recaudación tributaria? temporales de
peruano 2019.
recaudación tributaria.

Si se evalúa la Red Estacionalidad sin


¿La evaluación del modelo Evaluar el modelo Neuronal Artificial y el tendencia
basado en Red Neuronal basado en Red Algoritmo Hill Estacionalidad y
Artificial y el Algoritmo Neuronal Artificial Climbing en relación a tendencia
Hill Climbing en contraste y el Algoritmo Hill la serie temporal de Estacionalidad y
con la serie temporal de la Climbing con la recaudación tributaria tendencia %
recaudación tributaria del serie temporal de la del Estado peruano
Modelo basado en
Estado peruano 2019 recaudación 2019 entonces se
datos mensuales
permitirá validar el tributaria del Estado comprueba la
algoritmo de la red? peruano 2019. predicción significativa
de recaudación
32

2. ANEXO 2: CUESTIONARIO

También podría gustarte