Está en la página 1de 4

Herramientas data mining

La Minera de Datos (DM) por las siglas en ingls Data Mining es el proceso de
extraer conocimiento til y comprensible, previamente desconocido, desde
grandes cantidades de datos almacenados en distintos formatos. Las
herramientas de Data Mining predicen futuras tendencias y comportamientos,
permitiendo en los negocios la toma de decisiones. Una de las cualidades ms
destacables en las herramientas escogidas: Weka y RapidMiner, es su sencillez,
tanto en su aprendizaje como en su aplicacin, reduciendo as los costos de
implantacin en un equipo de desarrollo, lo cual ha llevado hacia
un inters creciente en las herramientas de software libre.
Actualmente, es ampliamente utilizado en las prcticas de perfil, como
vigilancia, comercializacin, descubrimientos cientficos, y deteccin de
fraudes.
Hay cuatro tipos de tareas que normalmente se involucran en la minera de
datos:
Clasificacin la tarea de generalizar una estructura familiar para
utilizarla en los nuevos datos
Agrupamiento la tarea de encontrar grupos y estructuras en los datos
que son de alguna manera u otra lo mismo, sin necesidad de utilizar las
estructuras observadas en los datos.
Aprendizaje de reglas de asociacin Busca relaciones entre las
variables.
Regresin Su objetivo es encontrar una funcin que modele los datos
con el menor error

Orange
Es una suite de software para minera de base de datos y aprendizaje
automtico basado en componentes que cuenta con un fcil y potente, rpido
y verstil front-end de programacin visual para el anlisis exploratorio de
datos y visualizacin, y librerias para Python y secuencias de comando.
Contiene un completo juego de componentes para pre procesamiento de datos,
caracterstica de puntuacin y filtrado, modelado, evaluacin del modelo, y
tcnicas de exploracin. Est escrito en C++ y Python, y su interfaz grfica de
usuario se basa en la plataforma cruzada del framework Qt.

S.O.
Windows
Mac OSX
Linux: Debian, Ubuntu y derivados

Bases de datos

Orange es una herramienta de desarrollo de bases de datos y gestin del


rendimiento que simplifica el proceso de gestin de base de datos y
aumenta la productividad. Es una herramienta para los desarrolladores de
Oracle y los administradores, especialmente para desarrolladores de
aplicaciones SQL y PL / SQL. Aunque orange tambin es compatible con:
IBM
DB2
MS SQL Server
Sybase.

Costo
Gratis

Clementine/SPSS
Herramienta de data mining que permite desarrollar modelos predictivos y
desplegarlos para mejorar la toma de decisiones. Est diseada teniendo en
cuenta a los usuarios empresariales, de manera que no es preciso ser un
experto en data mining.
Clementine es la ms avanzada herramienta de Data Mining del mercado,
combina modernas tcnicas de modelamiento con poderosas herramientas de
acceso, manipulacin y exploracin de datos en una interfaz simple e intuitiva.

Caractersticas

S.O.
Oracle

Fcil entendimiento de los datos.


Visualizacin interactiva.
Poderosa preparacin de los datos.
Combina datos de mltiples fuentes.
Especifica valores perdidos.
Deriva nuevas variables.
Produce informacin resumida.
Incrementa la productividad con su enfoque visual de la manipulacin de
datos.
Tcnicas de Modelado.
Tcnicas Supervisadas: C&RT, Redes Neuronales, C5.0, Quest,
CHAID, Regresin Lineal y Regresin Logstica.
Tcnicas No Supervisadas: K-medias, Kohonen, Bi-etpico, Apriori, GRI,
Sequence, Carma, Deteccin de Anomalas.
Tcnicas de Evaluacin: Tablas Estadsticas, Grficos de Ganancia y ROI.
Tcnicas de Publicacin de modelos: Punteo o Scoring de Bases de
Datos, Scoring en tiempo real.

MySQL

También podría gustarte