Está en la página 1de 6
| Wy nna tH SSSA fl 4 Yh LAA SSS SO QRVVW NH ZG jz SS \ AK : SSSFE SES WN \B6 4 44E—_ i SSS SS 888 EE =a : SS = — = = Ss sg r08 — a Fv i PAIN 1| SSS5j ZELMA SSSsssay jp a Y/ Uf \ i Zo s , Yi y ‘ > SS —Y////f \ AW | Mf fb J AN Mineria de datos: concepto y aplicaciones. Marvin Coto-Jiménez. a Reeibido: 21 de enero de 2013. Aceptado: 15 de abril de 2013. Resumen Se presenta la mineria de datos como un conjunto de técnicas para obtener informacién itil y no evidente en datos de diversos tipos, Primero se revisa el con ccepto y su evolucion, para repasar varias de Ins apli- caciones actuales y describir su potencial. Especial mente en Internet, La conelusién principal es lai portancia de su desarrollo y la formacién de profe- sionales en esta drea. Palabras clave: mineria de datos, bases de datos, inteligeneia artificial 1. Introducein En el aiio 1889, Herman Hollerit patenté en los Es- tados Unidos de América una mAquina tabuladora automética, que lefa tarjetas perforadas. Los patro- nes registrarlos en las tarjetas disinguian los diferen- tes aspectos en los registros de personas. El objet: vo del invento fue procesar la informacion del cen- so de 1890 en ese pais, gracias a lo cual fue po ble realizar esta tarea en un aio en lugar de casi tuna década que se requeria en el procesamiento ma- nual. Esta referencia la podemos eonsiderar como el primer desarrollo de una herramienta maquinal pa- Fa procesar gran cantidad de datos, 1o cual consti- tuye tno de los principios fundan neria de datos. sntales de la mi- Como concepto, la minerfa de datos se utiliza de la manera que se entiende en la actualidad hasta princi pos de 1990, Pretende una analogia con el proceso de extraer materiales valiosos en una mina: En ésta hay ‘gran cantidad de materiales (datos), que se procesan de forma extensa para obtener esas menores cantida- des de material precioso buseadlo y que no era visible en el conjunto original (informacién stil). En el ea- 0 de la miquina de Hollerit, la mineria, en su estado prinitivo, consistié en llegar a conelusiones numé ‘eas baisicas, con la ventaja del tiempo que fue posible obtenerlas. La tabla 1 resume la evolucién de las tec- nologias utilizadas y las caraeteristicas del concep- to desde 1960. La caracteristica actual de ser pros- pectiva se refiere a su utilizacién para prever resul- tados futuros, 1o cual es de sumo interés para la to- ma de decisiones en mercados dinémicos y de al- ta competencia, como los que se desarrollan en In- ternet. Como se deseribiré en la seccidn 3, los desa~ rrolladores y empresas que fineionan en la red In~ ternet tienen gran interés en los resultados que es tas téenicas pueden ofrecer El proceso de mineria de datos es visto como una cevolucién natural de la teenologta de la informacién, ‘en el que la informacion se extrae de bases y almaco- nes de datos. La fionalidal de los resultados bus- cados con ésta se pueden clasificar en dos grandes ceategorias [I 1. Fimcionalidades descriptivas: Enfocadas en bus- car patrones en los datos que puedan ser inter- pretables por el ser humano. Por ejemplo, earae: terizaciones (generalidades de los datos), anéii sis de asocinciones (reglas presentes en el con} to) o de agrupamientos (subconjuntos semeja tes de datos) no evidentes, 2, Funcionalidades predictivas: Enfocadas en buscar predicciones basadas en infereneias, generalmen- te sobre modelos abstractos. Por ejemplo, clasifi cacién y regresién (modelos que describan y dis- tingan subconjuntos de datos). En la seccién 3 se detallan varios ejemplos concretos de cada uno de estos tipos. Una distineién que plantea el obtener datos adicio- nales, a manera de informacién wtil, de tener sola- mente los datos, es el valor que éstos tienen. Con- tar con gran cantidad de datos, por ejemplo un ban- ‘co sobre sus cliontes, no garantiza que sea de util dad para aleanzar o mejorar los objetivas de la en- tidad, a menos que se pueda extraer de esa infor- maci6n algo itil sobre lo que se pueda tomar deci sioues y después evaluarlas. La cantidad de informa- ién puede ser mas bien un obstaculo si no se euen- ta com las técnicas y capacidad adecuada para pro- cesarla para pasar de solo informacién a conocimien- ton la forma de informacién titi. 2. Implementacién y metodologi Las téenieas utilizadas en mineria van desde herra- mientas estadistieas hasta herramientas de inteligen 102! bytes de estos datos ¢ Internet [16]. Debido a lo dingmico de la informs ci6n y Ia velocidad con que se genera, el interés es poder encontrar tendencias, relaciones y en general hipotesis validas que permitan tomar decis trategias de desarrollo y de mercado para obtener ventajas. Para las empresas, el aprovechamiento de la mineria para datos cle estas caracteristieas representa retos tanto en infraestructura de almacenamiento ¥ proce- siento como en la eaptacién de personal capacita- do que preda adaptar ¢ innovar para las aplicaciones specifieas. Solamente en Estados Unidos de Amér «a, se estima que en el aio 2018 habe: {de 140 000 a 190 000 expertos con estos conocimie tos [17]. Los resultados de la mineria en Big Data pueden tener un impacto tan grande como det nar relaciones de causalidad entre eventos econém 0s y noticias generadas en multiples campos [1 Se trata entonces de una nneva tendencia con gran- es posibilidades de desarrollo ¢ importantes retos por si complejidad y In velocidad con que requie- ro los resultaclos. Conelusiones La minerfa de datos es un conjunto de téenieas para cextraer informaci6n titil de grandes cantidades de da- tos en cortos periados de tiempo. Ha sido de especial importaneia desde la aparicién de las computado- ras, y ha evolucionado de forma paralela a éstas, gra- ins a Ia facilidad de realizar céleulos eada ver mis ripido, y ln ereciente cantidad de informacién genc- rada en redes de computadloras y entidades financie- ras, empresariales y comerciales Se destaca la diversidad de aplicaciones donde ha mostrado su utilidad y ol interés cada vez mayor por implementarla y aprovechar las ventajas que ha mos- trado, lo cual la puede eolocar entre las érens priori tarias para In formacién de profesionales en el cam- po de tecnologias de la informacién. Su uso actual y potencial en Internet plantea re- tos de interés para la investigacién, con resultados que podrian verse a corto plazo y aportar al can bio en la utilidad de las redes para fines académi- ‘cos y comerciales. Referencias 1, Daylan, A Bertan, ¥; y Badur, 0. An Bxperimen- tal Study for Extending Data Mining Standards. International Review on Computers and Software (LRE.CO.S.), Vol. (3): 936-346 (2011). 2, Aldana, W. Data mining industry: Emerging New ‘Trends and New Opportunities. Master Engineering in Blectricnl Engineering and Computer Science at the Massachusetts Institute of Technology, 2000. 3 Garrido, L. y Latorre, J. Aplicaciones empresari les de Data Mining. QUESTIIO, Vol. 25(3}: 499-508 (2001). 4, Nirkhi, 8. Potential use of artificial neural network in data mining. The 2nd International Conference ‘on Computer and Automation Engineering (ICCAE)) IBEE, Vol. 2: 339-343 (2010) Griinig, R. y Kithn, R. Suecessfud Decision-making, A Systematic’ Approach to Compler Problems. Segunda cediciedn, Springer 2009, 6. Barrientos, Rocio et at, Arboles de decisién como he- rramienta en el diagnéstico médico. Revista Médica UV Vol 9(2}: 19-24 (2009). 7, Covllo, C. Introduccién a ta Computacién Kvo- lutiva, CINVESTAV-IPN, 2012. Disponible en: http: / /deltaes.cinvestav.mx/ ecoello/genctic html 8. Gong, A. y Lui, Y. Improved KNN Classification Algorithm by Dynamic Obtaining K, Adeanced Re- search on Bleetronie Commeree, Web Application, and Communicatio. International Conference, EC- WAC (2011), 9 Graymala-Busse, J,W.: Rule induetion. Date Mining and Knowledge Discovery Handbook, 2nd edn. pp. 219.265. Springer, Heidelberg (2010), 10, Brendan J. y Delbert D, Clustering by Passing Mes- sages Between Data Points, Science. Feb. 2007. AL. Zaiane, O. Principles of Knowledge Discovery in Da- {tabases. University of Alberta. Department of Com- puting Science. 1999, 12. Baeza-Yates, R. Tendencias en mineria de datos de la Web. BI profesional de ta informacién. Vol 18(1): 5-10 (2000) 13, Vallejos, 8. Minerva de Datos. Universidad Nacional del Nordeste. Argentina 2006, 1M, Tabladillo, M. Por qué__utilizar datos? The SolidQTM Journal, www solidq.com/sqj 15, Pagola, J. Estado del Arte det Web, Centro de Apli- ceaciones de ‘Tecnologfas de Acanzada, Cuba. 2007, 16. Merian, L. IT looks for new tools to explot "Big Da- ta’, Computer World, 2011, 17. Stackpole, B. Your Big Data To-Do List, Computer World, Feb. 13 2012. 18. Lamont, J. Big data has big implications for kno- wledge management. KmWorld, April 2012. [es] ninerfa de Julio 2010-

También podría gustarte