Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PROGRAMA EDUCATIVO
INGENIERÍA INFORMATICA
ASIGNATURA
TALLER DE INVESTIGACION I
DOCENTE
MARMOL ENRIQUE SANTOS QUINTERO
TESIS
USO DE LA MINERIA DE DATOS EN SISTEMAS
GUBERNAMENTALES PARA LA PREDICCION DE EVENTOS
ACTIVIDAD - AVANCE
2.3 OBJETIVOS DE LA INVESTIGACION GENERALES Y
ESPECIFICOS - 2.4 JUSTIFICACION.
PRESENTA
MOISES MARTINEZ FLORES
FABIAN DE JESUS LOPEZ AMARO
SEMESTRE
4°
26 DE ABRIL DE 2021
2.3 OBJETIVOS DE LA INVESTIGACION
GENERALES Y ESPECIFICOS
OBJETIVO GENERAL: Conocer, comprender las técnicas básicas de minería
de datos y saber cómo se aplican en problemas concretos (en sistemas
gubernamentales) de extracción de conocimiento útil para el análisis, la toma de
decisiones y predicción de eventos.
OBJETIVOS ESPECIFICOS:
Selección
o Recopilar e integrar las fuentes de datos existentes
o Identificar y seleccionar las variantes relevantes en los datos
o Aplicar las técnicas de muestreo adecuadas
Exploración
o Utilizar las técnicas de análisis exploratorio de datos
o Deducir la distribución de los datos, simetría y normalidad
o Analizar las correlaciones existentes en la información
Limpieza
o Detectar y tratar la presencia de valores atípicos (outliers)
o Imputar la información faltante o valores perdidos (datos missing)
o Eliminar datos erróneos e irrelevantes.
Transformación
o Utilizar las técnicas de reducción y aumento de la dimensión
o Aplica técnicas de discreción y numeración
o Realizar escalado simple y multidimensional
Minería de datos
o Utilizar técnicas predictivas
o Utilizar técnicas descriptivas.
Evaluación e interpretación de resultados
o Intervalo de confianza
o Bootstrap
o Análisis ROC
o Evaluación de modelos
Difusión y uso de modelos
o Visualización
o Simulación
2.4 JUSTIFICACION
La justificación a la parte de un proyecto de investigación que expone las
razones que motivaron a realizar esa investigación. La justificación es la
sección en la que se explica la importancia y los motivos que llevaron al
investigador a realizar el trabajo.
Entre los criterios utilizados para redactar una justificación se toman en cuenta
la utilidad de la investigación para otros académicos o bien para otros sectores
sociales (funcionarios públicos, empresas, sectores de la sociedad civil), la
trascendencia en el tiempo que puede tener, el aporte de nuevas herramientas
o técnicas de investigación, la actualización de conocimientos preexistentes,
entre otros. Además, el lenguaje debe ser formal y descriptivo.
En estos tiempos que corren denominados “la era de la información” en la
cual, la sociedad, los clientes y las empresas están cambiando. Estos tres
grupos cada vez generan e intentan procesar más y más datos, cantidades que
para muchos son imposibles de imaginar. Para lograr adquirir y analizar tanta
información surge el término Big Data. Un término joven que presenta
confusión respecto a su alcance. En este trabajo se tratará de aclarar en qué
consiste, su alcance, como lo utilizan las empresas y en qué situación se
encuentra. Además, también se abarcará otros términos relacionados con Big
Data, como pueden ser la minería de datos, el Cloud Computing o el Data
Warehouse. Igualmente, también se aclarará porqué surge Big Data, de donde
procede y por que para muchos tecnólogos sugiere un cambio de etapa en el
mundo de las Tics.
JUSTIFICACION
Existe la etapa llamada de Data Mining, en la cual se introducen los datos para
el algoritmo y finalmente una etapa de post-procesamiento que consiste en
eliminar conocimientos, que muchas veces resultan obvios y solo dejar aquellos
que verdaderamente puede servir para una toma de decisión.
Entonces, validar una hipótesis inspirada por los datos en los datos mismos que
sea numéricamente significativa, pero que experimentalmente puede no ser
necesariamente válida o puede ser incompleta. De ahí que la minería de datos
debe presentar un enfoque 10 exploratorio y no necesariamente confirmativo.
Por esto, usar la minería de datos para confirmar nuestras hipótesis puede ser
peligroso, pues estamos haciendo se puede estar realizando una inferencia
poco válida.