Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guardar
Las herramientas de arrastrar y soltar de este punto de referencia (Fuentes: dataiku.com, mljar.com,
orange.biolab.si, cs.waikato.ac.nz/ml/weka/, knime.com, rapidminer.com)
Requerimientos mínimos:
Las herramientas de AutoML están excluidas de este punto de referencia (ya que ese
no es el objetivo)
Porque claramente no quiero obligar a nadie más a usar el producto, por lo que debe
haber una manera fácil de exportar lo que he hecho a otro lenguaje.
Datos: https://www.dataiku.com/product/features/machine-learning/
Weka: https://www.cs.waikato.ac.nz/ml/weka/
MLjar: https://mljar.com/
KNIME: https://www.knime.com/knime-analytics-platform
Naranja: https://orange.biolab.si/
Los que no proponen una versión gratuita (los periodos de prueba no se consideran una
versión gratuita):
Modelador SPSS ( https://www.ibm.com/products/spss-modeler )
Versión profesional: $7500 POR USUARIO, POR AÑO: 100 000 filas de datos, 2
procesadores lógicos, soporte empresarial, Turbo Prep, modelo automático
Versión empresarial: $ 15,000 POR USUARIO, POR AÑO: filas de datos ilimitadas,
procesadores lógicos ilimitados, soporte empresarial, Turbo Prep, modelo automático,
operaciones de modelo automatizadas, ejecución de procesos en segundo plano
Conclusión de RapidMiner
La versión gratuita de RapidMiner solo admite 10000 filas de datos y 1 procesador lógico.
Esto es tan limitado que para mí no vale la pena probar su solución.
Esto es tan limitado que, para mí, no vale la pena probar su solución.
Abrir en la aplicación Empezar
Reseña 2 — Dataiku
Enlace: https://www.dataiku.com/product/features/machine-learning/
Esta versión gratuita me parece aceptable, así que pasemos al siguiente punto.
Uso de PMML
Dataiku me asusta un poco con los avisos de advertencia que indican que "No todos los
algoritmos son compatibles con esta función" y que "Este cuaderno generado es solo para
fines educativos y explicativos. En particular, este portátil no reproduce todas las
capacidades de preprocesamiento de DSS y es solo una aproximación de mejor esfuerzo
del modelo entrenado en DSS”.
Conclusión de Dataiku
Dataiku seems a good tool to check out. Dataiku’s interoperability would be the first thing
to test if I go on with it, but it is not a stopper for now.
Review 3 — Weka
Link: https://www.cs.waikato.ac.nz/ml/weka/
Weka Pricing or Free Version
Abrir en la aplicación Empezar
Weka’s GUI is less smooth than RapidMiner and Dataik. It seems to be between a GUI tool
and a GUI wrapper for code, so I am not sure whether it has much advantage compared to
using Python notebooks for example.
But Weka is free and open source: that is awesome, and that is why I keep it in the list.
Review 4 — MLjar
Review 4 MLjar
Link: https://mljar.com/ Abrir en la aplicación Empezar
MLjar Conclusion
MLjar seems to be starting something interesting, but for now, their solution does not
seem good enough for the price and the very limited free version.
Knime conclusion
Knime gives me a very positive impression since they have a very elaborate free version,
good interoperability, and a good list of models. The GUI also looks quite smooth. And
open source! This is worth checking out.
Review 6— Orange
Link: https://orange.biolab.si/getting-started/
Orange conclusion
Orange has quite some good features. It is open source and it seems quite smooth.
Unfortunately, the interoperability part is a real bummer on Orange.
1. Knime seems the best option, as I really like that it is open source. Knime gives me a
very positive impression since they have a very elaborate free version, good
interoperability, and a good list of models. The GUI also looks quite smooth. And open
source! This is worth checking out.
2. Dataiku seems a good tool to check out. It’s paid version seems not too limited and it
seems quite powerful.
RapidMiner’s free version supports only 10000 data rows and 1 logical processor. This
is so limited that — for me — it’s not worth testing their solution.
Weka seems a good product to check out: the big question is whether it has added
value compared to using Jupyter Notebooks.
MLjar parece estar comenzando algo interesante, pero por ahora, su solución no
parece lo suficientemente buena para el precio solicitado y la versión gratuita muy
limitada.
Gracias por leer mi artículo, espero que te haya sido útil. ¡No dudes en estar atento a más!
Abrir en la aplicación Empezar
Regístrate en La Variable
Por Hacia la ciencia de datos
Todos los jueves, Variable ofrece lo mejor de Hacia la ciencia de datos: desde tutoriales prácticos e
investigaciones de vanguardia hasta funciones originales que no querrá perderse. Echar un vistazo.