Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La Minera de Datos (DM) por las siglas en ingls Data Mining es el proceso de
extraer conocimiento til y comprensible, previamente desconocido, desde
grandes cantidades de datos almacenados en distintos formatos. Las
herramientas de Data Mining predicen futuras tendencias y comportamientos,
permitiendo en los negocios la toma de decisiones. Una de las cualidades ms
destacables en las herramientas escogidas: Weka y RapidMiner, es su sencillez,
tanto en su aprendizaje como en su aplicacin, reduciendo as los costos de
implantacin en un equipo de desarrollo, lo cual ha llevado hacia
un inters creciente en las herramientas de software libre.
Actualmente, es ampliamente utilizado en las prcticas de perfil, como
vigilancia, comercializacin, descubrimientos cientficos, y deteccin de
fraudes.
Hay cuatro tipos de tareas que normalmente se involucran en la minera de
datos:
Clasificacin la tarea de generalizar una estructura familiar para
utilizarla en los nuevos datos
Agrupamiento la tarea de encontrar grupos y estructuras en los datos
que son de alguna manera u otra lo mismo, sin necesidad de utilizar las
estructuras observadas en los datos.
Aprendizaje de reglas de asociacin Busca relaciones entre las
variables.
Regresin Su objetivo es encontrar una funcin que modele los datos
con el menor error
Orange
Es una suite de software para minera de base de datos y aprendizaje
automtico basado en componentes que cuenta con un fcil y potente, rpido
y verstil front-end de programacin visual para el anlisis exploratorio de
datos y visualizacin, y librerias para Python y secuencias de comando.
Contiene un completo juego de componentes para pre procesamiento de datos,
caracterstica de puntuacin y filtrado, modelado, evaluacin del modelo, y
tcnicas de exploracin. Est escrito en C++ y Python, y su interfaz grfica de
usuario se basa en la plataforma cruzada del framework Qt.
S.O.
Windows
Mac OSX
Linux: Debian, Ubuntu y derivados
Bases de datos
Costo
Gratis
Clementine/SPSS
Herramienta de data mining que permite desarrollar modelos predictivos y
desplegarlos para mejorar la toma de decisiones. Est diseada teniendo en
cuenta a los usuarios empresariales, de manera que no es preciso ser un
experto en data mining.
Clementine es la ms avanzada herramienta de Data Mining del mercado,
combina modernas tcnicas de modelamiento con poderosas herramientas de
acceso, manipulacin y exploracin de datos en una interfaz simple e intuitiva.
Caractersticas
S.O.
Oracle
MySQL