Está en la página 1de 2

Bueno, lo que hicimos a partir de la información de los documentos, del contexto, del tipo y la

naturaleza de los datos, es tratar de resumir una serie de herramientas que podrían
implementarse para el análisis, la visualización, el data cleaning y para la gestión como tal del
proyecto.

Recordemos que la metodología CRISP-DM busca analizar un problema y transformarlo en un


problema técnico de minería de datos. Para el análisis de los datos es necesario utilizar
herramientas que faciliten estas tareas y entre estas se encuentran las herramientas de ingeniería
de software asistidas por computador. Estas herramientas soportan en forma automática varios o
todos los pasos de la metodología CRISP que estamos abordando y lo más importante es que
ayudan a reducir el tiempo empleado en el desarrollo de un sistema, lo que mantiene el costo
estable y contribuye a mejorar su calidad. Además, nos permiten documentar y modelar un
sistema, desde la definición de requerimientos hasta el diseño, implementación y la evaluación.

Todas estas herramientas puede que tengan un costo o pueden ser gratuitas, proveen una interfaz
de usuario, un proceso en el que se basan y cierta capacidad para ampliar el conjunto de
algoritmos que ofrece la herramienta, como también un soporte para el desarrollo y gestión del
proyecto en equipos de trabajo.

En cuanto a la cantidad de herramientas disponibles en el mercado, se han evaluado de manera


que se satisfagan ciertos criterios y capacidades como las que se mencionarion anteriormente.
Entre otras que ofrezcan flexibilidad, rendimiento, gestión de modelos, etc.

Y como vemos en este cuadrante las mejores herramientas son RapidMiner, Knime, SAS e IBM.

Ahora vamos a detallar solo algunas de estas herramientas que se adaptan a la metodología
CRISP-DM, sobre todo para los pasos que siguen a la comprensión del negocio.

RAPIDMINER

Rapidminer es un software de minería de datos gratuito, es implementado en Java, por lo que es


multiplataforma. Este programa permite el desarrollo de procesos de análisis de datos mediante el
encadenamiento de operadores a través de un entorno gráfico y se suele utilizar en investigación y
en aplicaciones empresariales

Entre sus características están, que puede usarse a través de una interfaz gráfica, línea de
comandos, o incluso desde otros programas a través de llamadas a sus bibliotecas.

• Incluye gráficos y herramientas para la visualización de los datos.

• Dispone de un módulo de integración con el lenguaje de programación para análisis estadístico


“R”.

VENTAJAS
Como ventajas es que esta plataforma ya se ha utilizado en distintas áreas, como es el pronostico
en ventas, segmentación de clientes, el análisis de riesgo en el sector de Fabricación, por tanto
posee una amplia gama de algoritmos

Su interfaz grafica es fácil de usar y se puede acceder a tipos de archivos de paquetes estadísticos
conocidos como STATA.

Y su principal desventaja es que para la versión gratuita no ofrece soporte para grandes
volúmenes de datos

Knime

KNIME, Pronunciacion NAIM. La k es muda. Esta plataforma es de código abierto, también es


desarrollada en Java y posee una interfaz gráfica funcional y facil de aprender.

 Esta plataforma fue especialmente creada para soportar grandes volúmenes de datos, para
analizar y crear modelos de exploración visual para descubrir información potencial que se
encuentra oculta en los datos y ayuda a predecir eventos futuros en diversas áreas, como por
ejemplo el sector financiero, o para nuestro caso que es el sector salud podría funcionar bastante
bien.

Tiene modulos para combinar herramientas para Python, R, SQL y muchos más.

VENTAJAS

Como ventajas esta que por ser de uso libre, esta disponible para cualquier persona.

Tiene soporte continuo, asi que sus productos tienen mejoras constantes

Ademas de tener una comunidad activa y proveedores de software independiente

DESVENTAJAS

Como desventaja presenta problemas con la gestión del modelo cuando se trata de grandes flujos
de trabajo

Entre muchas otras herramientas, tenemos el paquete estadístico STATA o SPSS que
también funcionan con bases de datos grandes e interfaces medianamente amigables.
Crystall Ball de Oracle que funciona para el modelaje y utiliza técnicas de optimización. Y
también minitab que ofrece herramientas estadísticas de visualización para analizar cierta
cantidad de datos.

También podría gustarte