Documentos de Académico
Documentos de Profesional
Documentos de Cultura
naturaleza de los datos, es tratar de resumir una serie de herramientas que podrían
implementarse para el análisis, la visualización, el data cleaning y para la gestión como tal del
proyecto.
Todas estas herramientas puede que tengan un costo o pueden ser gratuitas, proveen una interfaz
de usuario, un proceso en el que se basan y cierta capacidad para ampliar el conjunto de
algoritmos que ofrece la herramienta, como también un soporte para el desarrollo y gestión del
proyecto en equipos de trabajo.
Y como vemos en este cuadrante las mejores herramientas son RapidMiner, Knime, SAS e IBM.
Ahora vamos a detallar solo algunas de estas herramientas que se adaptan a la metodología
CRISP-DM, sobre todo para los pasos que siguen a la comprensión del negocio.
RAPIDMINER
Entre sus características están, que puede usarse a través de una interfaz gráfica, línea de
comandos, o incluso desde otros programas a través de llamadas a sus bibliotecas.
VENTAJAS
Como ventajas es que esta plataforma ya se ha utilizado en distintas áreas, como es el pronostico
en ventas, segmentación de clientes, el análisis de riesgo en el sector de Fabricación, por tanto
posee una amplia gama de algoritmos
Su interfaz grafica es fácil de usar y se puede acceder a tipos de archivos de paquetes estadísticos
conocidos como STATA.
Y su principal desventaja es que para la versión gratuita no ofrece soporte para grandes
volúmenes de datos
Knime
Esta plataforma fue especialmente creada para soportar grandes volúmenes de datos, para
analizar y crear modelos de exploración visual para descubrir información potencial que se
encuentra oculta en los datos y ayuda a predecir eventos futuros en diversas áreas, como por
ejemplo el sector financiero, o para nuestro caso que es el sector salud podría funcionar bastante
bien.
Tiene modulos para combinar herramientas para Python, R, SQL y muchos más.
VENTAJAS
Como ventajas esta que por ser de uso libre, esta disponible para cualquier persona.
Tiene soporte continuo, asi que sus productos tienen mejoras constantes
DESVENTAJAS
Como desventaja presenta problemas con la gestión del modelo cuando se trata de grandes flujos
de trabajo
Entre muchas otras herramientas, tenemos el paquete estadístico STATA o SPSS que
también funcionan con bases de datos grandes e interfaces medianamente amigables.
Crystall Ball de Oracle que funciona para el modelaje y utiliza técnicas de optimización. Y
también minitab que ofrece herramientas estadísticas de visualización para analizar cierta
cantidad de datos.