Está en la página 1de 7

CURSO:

TOPICOS ESPECIALES EN
PROCESAMIENTO PARALELO

GRUPO: 7

AUTOR(ES):
-González Saira Fabio Martín
-Chávez Guevara Jhon Ronaldo
- Nuñez Saldarriaga Guillermo

ESCUELA: Informática

2021
Universidad Nacional de Trujillo

ESTADO DEL ARTE


PROGRAMACIÓN PARALELA
APLICADA EN LA MINERÍA
DE DATOS
Resumen y Palabras Claves

La minería de datos surge del potencial para analizar grandes volúmenes de datos, con el
objetivo de obtener conocimientos que apoyen la toma de decisiones y para construir una
experiencia basándose en millones de transacciones registradas por las empresas en sus
sistemas de información. El objetivo principal de esta investigación es conocer el estado del
arte de la programación paralela aplicada a la minería de datos. Esto implica dar a conocer los
conceptos como la minería de datos y programación paralela, así como informar sobre los
avances más recientes de dicha aplicación de programación paralela, los resultados que se
han obtenido, así como dar nuestro punto de vista acerca de los próximos avances respecto a
esta tecnología.
Desarrollo del Contenido:

Minería de Datos
Antiguamente las empresas utilizaban sus datos para incrementar sus sistemas
contables y financieros, así como para inventarios, procesos de producción, recursos
humanos y ventas. Sin embargo, a medida que los negocios se hacen más
competitivos, los datos se convierten en información vital para la toma de decisiones,
de tal forma que las empresas se han interesado en automatizar procesos utilizando
dichos datos.
Gracias a la velocidad con la que la tecnología evoluciona, las empresas mejoran
continuamente sus esquemas de administración y toma de decisiones. Una de las
técnicas más usadas para extraer información de una gran cantidad de datos, es la
minería de datos, que combina técnicas semiautomáticas de inteligencia artificial,
análisis estadístico, bases de datos y visualización gráfica, para la obtención de
información implícita entre los datos.
Esta técnica es capaz de descubrir relaciones, tendencias, desviaciones,
comportamientos atípicos, patrones y trayectorias ocultas, con el propósito de soportar
los procesos de toma de decisiones contando con un mayor conocimiento.(Ballesteros
et al., 2018)

Programación paralela

La programación paralela reemplaza la necesidad actual de más potencia de cálculo


en el pronóstico del tiempo, la bioinformática, la astrofísica y muchos otros campos.
Las computadoras secuenciales tradicionales no están asociadas con sistemas cada vez
más complejos que requieren más tiempo de cálculo, pero son significativamente más
rápidos.(Algoritmo paralelo para la obtención de predicados difusos: Parallel
Algorithm to obtain fuzzy predicates, s/f)
La minería de datos y la programación paralela

La minería de datos abarca un campo interdisciplinario que tiene como principal


objetivo extraer patrones que permitan identificar un conocimiento previamente
desconocido desde las bases de datos.

La tendencia al avance de la tecnología ha abierto las puertas a poseer enormes


cantidades de datos, donde su análisis tomaría demasiado tiempo y costo realizarlo
utilizando herramientas tradicionales, lo cual ha propiciado la aparición del término
Big Data.

Si al inicio el reto principal para la minería de datos era la obtención de patrones que
permitan obtener conocimiento, actualmente también lo es, el análisis de los grandes
sistemas de datos con los que se cuentan hoy en día.

Es por ello que el paralelismo resulta ser de gran importancia en esta área de la
computación, como vía de solución para que los algoritmos y técnicas puedan
procesar bases de datos con esta dimensión.(Aranda & Sotolongo, 2013)

Qué problemas se están resolviendo

Esta prometedora tecnología será capaz de analizar enormes volúmenes de datos con
facilidad y reconocer patrones en tiempo y espacio para la toma de decisiones y
construir un conocimiento corporativo de alto nivel.

Tendencias
Aspectos metodológicos: Sería muy útil la existencia de una API Standard, de forma
que los desarrolladores puedan integrar sin dificultad los resultados de los diversos
algoritmos de minería. Esto podría facilitar también la tarea de automatizar y
simplificar todo el proceso, integrando aspectos como muestreo, limpieza de datos,
minería, visualización, etc.
Escalabilidad: la escalabilidad de la minería de datos hacia grandes volúmenes de
datos es y será siempre una de las tendencias futuras, ya que el volumen de
información que se ha de tratar crece de manera exponencial, con lo que los avances
en esta área quedan siempre superados por las necesidades crecientes.
Simulación, integración en la toma de decisiones y minería de datos: los modelos
extraídos para un ámbito de interés de una organización. Básicamente se trata de
utilizar las salidas de unos modelos como entradas de otros y maximizar el beneficio
del conjunto de modelos. Además, pueden añadirse al modelo global restricciones de
valores máximos o mínimos (saturación), etc.
Minería para datos con una estructura compleja: en numerosas ocasiones los
datos procedentes de aplicaciones del mundo real no tienen una representación directa
en forma de una única tabla, sino que deben ser representadas mediante estructuras
jerárquicas (árboles), interrelacionadas (grafos), conjuntos, etc. Por lo tanto, el reto
que se lanza a la comunidad científica que investiga en aprendizaje automático y
minería de datos, es el de adaptar o proponer nuevas técnicas que permitan trabajar
directamente con este tipo de representaciones.
Cómo trabaja la minería de datos:
Para detectar situaciones interesantes y anomalías, el software se ayuda de varias
técnicas y procedimientos. Algunos son:
Umbrales: si se tiene un registro periódico de alguna variable se puede determinar un
máximo tolerado y un mínimo permitido.
Tendencias: este algoritmo se encarga de ver si en un periodo de observación hay un
cambio notable en las lecturas.
Franja de normalidad: como a menudo es posible que el comportamiento de las
variables se vuelva estacional en vez de hacer cuotas superiores e inferiores, podemos
hacer que el minero indique cuando la variable salga de la franja de normalidad
establecida, tomando en cuenta, cómo se comportó esa variable durante el año pasado.
(Riquelme Santos et al., 2006)
Referencias

Algoritmo paralelo para la obtención de predicados difusos: Parallel Algorithm to obtain

fuzzy predicates. (s/f). Recuperado el 31 de agosto de 2021, de

http://scielo.sld.cu/scielo.php?script=sci_arttext&pid=S2227-18992017000200009

Aranda, Y. R., & Sotolongo, A. R. (2013). Integración de los algoritmos de minería de datos 1R,

PRISM e ID3 a PostgreSQL. JISTEM - Journal of Information Systems and Technology

Management, 10, 389–406. https://doi.org/10.4301/S1807-17752013000200012

Ballesteros, H. F. V., Iñiguez, E. G., & Velasco, S. R. M. (2018). Minería de Datos. RECIMUNDO:

Revista Científica de la Investigación y el Conocimiento, 2(Extra 1), 339–349.

Riquelme Santos, J. C., Ruiz, R., & Gilbert, K. (2006). Minería de Datos: Conceptos y Tendencias.

https://idus.us.es/handle/11441/43290

También podría gustarte