Está en la página 1de 18

Base de Datos II Nathalie Tejena

Pasar la materia =)

Es el proceso que intenta descubrir patrones en grandes

conjuntos de datos. Utilizando mtodos de la inteligencia artificial, aprendizaje automtico, estadsticas y sistemas de bases de datos. informacin de un conjunto de datos y transformarlo en una estructura comprensible para su uso posterior. existentes que normalmente no se pueden detectar mediante la exploracin tradicional de los datos porque las relaciones son demasiado complejas o porque hay demasiado datos.

El objetivo general de minera de datos es extraer

Utiliza el anlisis matemtico para deducir los patrones

Es una coleccin de datos orientada a un determinado

mbito integrado, no voltil y variable en el tempo.


Es una base de datos utilizada para la presentacin de

informes y anlisis, es alimentado por numerosas fuentes, transformadas en grupos de informacin sobre temas especficos de negocios.
Sirve para permitir nuevas consultas, anlisis, y toma

de decisiones.

Extraer informacin til a partir de una gran cantidad

de datos
Encontrar patrones en los datos que no son visibles a

simple vista o mediante tcnicas tradicionales.


Explorar los datos se encuentran en las profundidades

de las bases de datos, como los almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos.

A partir de los patrones encontrados establecer

modelos que ayuden a la organizacin a la toma de decisiones


Prediccin automatizada de tendencias y

comportamientos.

Cuando las herramientas de Data Mining son

implementadas en sistemas de procesamiento paralelo de alta performance, pueden analizar bases de datos masivas en minutos.

Anlisis de varianza.

Regresin.
Prueba chi-cuadrado. Anlisis de agrupamiento o clustering.

Anlisis discriminante.
Series de tiempo. Redes Bayesianas.

Algoritmos genticos: Son mtodos numricos de optimizacin, en los que

aquella variable o variables que se pretenden optimizar junto con las variables de estudio constituyen un segmento de informacin.

Inteligencia Artificial: Entre los sistemas de Inteligencia Artificial se

encuadraran los Sistemas Expertos y las Redes Neuronales.

Sistemas Expertos: Principalmente a base de inferencias o de causa-efecto. Sistemas Inteligentes: Son similares a los sistemas expertos, pero con mayor

ventaja ante nuevas situaciones desconocidas para el experto.

Redes neuronales: Genricamente, son mtodos de proceso numrico en

paralelo, en el que las variables interactan mediante transformaciones lineales o no, hasta obtener unas salidas.

La extraccin de modelos predictivos es una tarea

frecuente en Minera de Datos y tiene como objetivo la generacin de modelos precisos e interpretables. La reduccin de datos es un pre-procesamiento interesante que puedeser empleado para extraer modelos con estas caractersticas en conjuntos de gran tamao. Este mtodo permite enfrentarse al problema de escalado que aparece al evaluar conjuntos de datos de gran tamao, ofreciendo modelos precisos e interpretables.

Es la separacin de los datos en subgrupos o clases

interesantes. Las clases pueden ser exhaustivas y mutuamente exclusivas o jerrquicas y con traslapes. Se puede utilizar con otras tcnicas de minera de datos: considerar cada subgrupo de datos por separado, etiquetarlos y utilizar un algoritmo de clasificacin. Se usan algoritmos de clustering, SOM (selforganization maps), EM (expectation maximization), k-means, etc. Normalmente el usuario tiene una buenacapacidad de formar las clases y se han desarrollado herramientas

El Web mining o Webmining es una metodologa de

recuperacin de la informacin que usa herramientas de la minera de datos para extraer informacin tanto del contenido de las pginas, de su estructura de relaciones (enlaces) y de los registro de navegacin de los usuarios. Pueden ser: Minera del contenido de la Web, o Web Content Mining; Minera de la estructura de la Web, o Web Structure Mining; Minera de los registro de navegacin en la Web, o Web Usage Mining.

Detectar los cambios ms significativos en los datos

con respecto a valores pasados o normales. Sirve para filtrar grandes volmenes de datos que son menos probables de ser interesantes. El problema est en determinar cundo una desviacin es significativa para ser de inters.

Anlisis de la cesta de la compra mediante reglas de

asociacin. Modelos para anlisis de riesgos (seguros, crditos...). Evaluacin de campaas publicitarias. Anlisis de la fidelidad de clientes (churning). Anlisis de valores de bolsa. Deteccin y prevencin de fraude en comercio electrnico. Modelos de trfico a partir de datos GPS. Perfiles de usuarios de redes. Deteccin de intrusos en redes.

Existen muchas herramientas de software para el desarrollo de modelos de

minera de datos tanto libres como comerciales como, por ejemplo: KXEN KNIME Orange Powerhouse Quiterian RapidMiner R SPSS Clementine SAS Enterprise Miner STATISTICA Data Miner Weka KEEL

Uso masificado de las tcnicas del data-mining.


Poder detectar de manera automatizada patrones

presentes en bases de datos


Mayor aprovechamiento de la tecnologa con

computadoras ms potentes y rpidas para la minera de datos

http://exa.unne.edu.ar/depar/areas/informatica/Sistemas

Operativos/Mineria_Datos_Vallejos.pdf http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos http://en.wikipedia.org/wiki/Data_mining http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos www.slideshare.net/janettejf/mineria-de-datos-3582262 http://www.lsi.us.es/redmidas/CEDI/papers/717.pdf http://es.wikipedia.org/wiki/Web_mining http://exa.unne.edu.ar/depar/areas/informatica/Sistemas Operativos/MonografiaMD.PDF