Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TOPICOS ESPECIALES EN
PROCESAMIENTO PARALELO
GRUPO: 7
AUTOR(ES):
-González Saira Fabio Martín
-Chávez Guevara Jhon Ronaldo
- Nuñez Saldarriaga Guillermo
ESCUELA: Informática
2021
Universidad Nacional de Trujillo
La minería de datos surge del potencial para analizar grandes volúmenes de datos, con el
objetivo de obtener conocimientos que apoyen la toma de decisiones y para construir una
experiencia basándose en millones de transacciones registradas por las empresas en sus
sistemas de información. El objetivo principal de esta investigación es conocer el estado del
arte de la programación paralela aplicada a la minería de datos. Esto implica dar a conocer los
conceptos como la minería de datos y programación paralela, así como informar sobre los
avances más recientes de dicha aplicación de programación paralela, los resultados que se
han obtenido, así como dar nuestro punto de vista acerca de los próximos avances respecto a
esta tecnología.
Desarrollo del Contenido:
Minería de Datos
Antiguamente las empresas utilizaban sus datos para incrementar sus sistemas
contables y financieros, así como para inventarios, procesos de producción, recursos
humanos y ventas. Sin embargo, a medida que los negocios se hacen más
competitivos, los datos se convierten en información vital para la toma de decisiones,
de tal forma que las empresas se han interesado en automatizar procesos utilizando
dichos datos.
Gracias a la velocidad con la que la tecnología evoluciona, las empresas mejoran
continuamente sus esquemas de administración y toma de decisiones. Una de las
técnicas más usadas para extraer información de una gran cantidad de datos, es la
minería de datos, que combina técnicas semiautomáticas de inteligencia artificial,
análisis estadístico, bases de datos y visualización gráfica, para la obtención de
información implícita entre los datos.
Esta técnica es capaz de descubrir relaciones, tendencias, desviaciones,
comportamientos atípicos, patrones y trayectorias ocultas, con el propósito de soportar
los procesos de toma de decisiones contando con un mayor conocimiento.(Ballesteros
et al., 2018)
Programación paralela
Si al inicio el reto principal para la minería de datos era la obtención de patrones que
permitan obtener conocimiento, actualmente también lo es, el análisis de los grandes
sistemas de datos con los que se cuentan hoy en día.
Es por ello que el paralelismo resulta ser de gran importancia en esta área de la
computación, como vía de solución para que los algoritmos y técnicas puedan
procesar bases de datos con esta dimensión.(Aranda & Sotolongo, 2013)
Esta prometedora tecnología será capaz de analizar enormes volúmenes de datos con
facilidad y reconocer patrones en tiempo y espacio para la toma de decisiones y
construir un conocimiento corporativo de alto nivel.
Tendencias
Aspectos metodológicos: Sería muy útil la existencia de una API Standard, de forma
que los desarrolladores puedan integrar sin dificultad los resultados de los diversos
algoritmos de minería. Esto podría facilitar también la tarea de automatizar y
simplificar todo el proceso, integrando aspectos como muestreo, limpieza de datos,
minería, visualización, etc.
Escalabilidad: la escalabilidad de la minería de datos hacia grandes volúmenes de
datos es y será siempre una de las tendencias futuras, ya que el volumen de
información que se ha de tratar crece de manera exponencial, con lo que los avances
en esta área quedan siempre superados por las necesidades crecientes.
Simulación, integración en la toma de decisiones y minería de datos: los modelos
extraídos para un ámbito de interés de una organización. Básicamente se trata de
utilizar las salidas de unos modelos como entradas de otros y maximizar el beneficio
del conjunto de modelos. Además, pueden añadirse al modelo global restricciones de
valores máximos o mínimos (saturación), etc.
Minería para datos con una estructura compleja: en numerosas ocasiones los
datos procedentes de aplicaciones del mundo real no tienen una representación directa
en forma de una única tabla, sino que deben ser representadas mediante estructuras
jerárquicas (árboles), interrelacionadas (grafos), conjuntos, etc. Por lo tanto, el reto
que se lanza a la comunidad científica que investiga en aprendizaje automático y
minería de datos, es el de adaptar o proponer nuevas técnicas que permitan trabajar
directamente con este tipo de representaciones.
Cómo trabaja la minería de datos:
Para detectar situaciones interesantes y anomalías, el software se ayuda de varias
técnicas y procedimientos. Algunos son:
Umbrales: si se tiene un registro periódico de alguna variable se puede determinar un
máximo tolerado y un mínimo permitido.
Tendencias: este algoritmo se encarga de ver si en un periodo de observación hay un
cambio notable en las lecturas.
Franja de normalidad: como a menudo es posible que el comportamiento de las
variables se vuelva estacional en vez de hacer cuotas superiores e inferiores, podemos
hacer que el minero indique cuando la variable salga de la franja de normalidad
establecida, tomando en cuenta, cómo se comportó esa variable durante el año pasado.
(Riquelme Santos et al., 2006)
Referencias
http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2227-18992017000200009
Aranda, Y. R., & Sotolongo, A. R. (2013). Integración de los algoritmos de minería de datos 1R,
Ballesteros, H. F. V., Iñiguez, E. G., & Velasco, S. R. M. (2018). Minería de Datos. RECIMUNDO:
Riquelme Santos, J. C., Ruiz, R., & Gilbert, K. (2006). Minería de Datos: Conceptos y Tendencias.
https://idus.us.es/handle/11441/43290