Está en la página 1de 3

5 startups de inteligencia artificial que lideran MLops

5 startups de inteligencia artificial que lideran MLops (cioperu.pe)

[29/06/2021] Junto con la enorme y creciente demanda de


aplicaciones de inteligencia artificial, existe una necesidad
complementaria de infraestructura y software de apoyo que hacen
posibles las aplicaciones de inteligencia artificial. Desde la preparación
de datos y la capacitación hasta la implementación y mucho más,
varias empresas emergentes han llegado a la escena para guiarle a
través del naciente mundo de MLops. A continuación, presentamos algunas de las más
interesantes, capaces de lograr que sus iniciativas de inteligencia artificial sean más exitosas.

Weights & Biases

Weights & Biases se está convirtiendo en una presencia importante en el campo del aprendizaje
automático, especialmente entre los científicos de datos que desean un servicio de seguimiento
de experimentos completo y bien diseñado. En primer lugar, W&B tiene una integración
inmediata con casi todas las bibliotecas populares de aprendizaje automático (además, es
bastante fácil agregar métricas personalizadas).

En segundo lugar, puede usar tanto W&B según lo necesite -como una versión turboalimentada
de TensorBoard, o también como una forma de controlar e informar sobre el ajuste de
hiperparámetros, o también como un centro de colaboración donde todos los miembros de su
equipo de ciencia de datos pueden ver resultados o reproducir experimentos realizados por
otros miembros del equipo. Para la empresa, W&B incluso se puede utilizar como una
plataforma de gobernanza y procedencia, proporcionando una pista de auditoría de qué inputs,
transformaciones y experimentos se utilizaron para construir un modelo, a medida que el
modelo pasa del desarrollo a la producción.

Ciertamente, sus científicos de datos ya conocen W&B, y si no lo están usando dentro de la


empresa, es casi seguro que querrán hacerlo. Si OpenAI, GitHub, Salesforce y Nvidia están
usando W&B, ¿por qué usted no?

Seldon

Seldon es otra empresa con una oferta de núcleo abierto que ofrece funciones empresariales
adicionales. El componente de código abierto es Seldon Core, una forma nativa de la nube de
implementar modelos con características avanzadas como cadenas arbitrarias de modelos para
inferencia, implementaciones canary, pruebas A/B y bandidos multibrazo, y soporte para
marcos de trabajo como TensorFlow, Scikit-learn y XGBoost listo para ser usados desde el inicio.
Seldon también ofrece la biblioteca Alibi de código abierto para el aprendizaje automático de
inspección de modelo y de explicación, que contiene una variedad de métodos para obtener
conocimientos sobre cómo se forman las predicciones del modelo.

Una característica interesante de Seldon Core es que es increíblemente flexible en cómo encaja
con su stack de tecnología. Puede usar Seldon Core por sí solo o colocarlo en una
implementación de Kubeflow. Puede implementar modelos que se han creado a través de
MLFlow, o puede usar el servidor de inferencia Triton de Nvidia, lo que da como resultado varias
formas diferentes en las que puede aprovechar Seldon para aprovecharlo al máximo.
Para la empresa, está Seldon Deploy, que proporciona un conjunto completo de herramientas
para la gobernanza de modelos, incluidos cuadros de mando, flujos de trabajo auditados y
supervisión del rendimiento. Esta oferta está dirigida a científicos de datos, SRE, así como a
gerentes y auditores. No se sorprenderá del todo al descubrir que el enfoque de Seldon en la
auditoría y la explicación ha hecho que esta startup, con sede en el Reino Unido, sea un éxito
entre los bancos; Barclays y Capital One utilizan sus servicios.

Si bien existen numerosos competidores en el campo de la implementación de modelos, Seldon


proporciona un conjunto completo de características y un enfoque sumamente importante en
la implementación de Kubernetes en su oferta principal, junto con adiciones empresariales
útiles para empresas que desean una solución más integral.

Pinecone / Zilliz

La búsqueda de vectores está al rojo vivo en este momento. Gracias a los avances recientes en
el aprendizaje automático en campos como el texto, las imágenes y el audio, la búsqueda
vectorial puede tener un efecto transformador en la búsqueda. Por ejemplo, una búsqueda de
"Kleenex” puede devolver la selección de tejidos de un minorista sin la necesidad de reglas
personalizadas de reemplazo de sinónimos, como el modelo de lenguaje utilizado para generar
un vector incrustado, colocará la consulta de búsqueda en la misma área del espacio vectorial.
Y se puede utilizar exactamente el mismo proceso para localizar sonidos o realizar
reconocimiento facial.

Aunque el software actual del motor de búsqueda no suele estar optimizado para realizar
búsquedas vectoriales, el trabajo continúa en Elastic y Apache Lucene, y se ofrecen una gran
cantidad de alternativas de código abierto con capacidad para buscar vectores a alta velocidad
y escala (por ejemplo, NMSLib, FAISS, Annoy). Además, han surgido muchas nuevas empresas
para aliviar parte de la carga de configurar y mantener los motores de búsqueda vectoriales de
su deficiente departamento de operaciones. Pinecone y Zilliz son dos de esas nuevas empresas
que brindan búsqueda vectorial para las empresas.

Pinecone es una oferta pura de SaaS, donde uno carga las incorporaciones producidas por sus
modelos de aprendizaje automático en sus servidores y envía consultas a través de su API.
Todos los aspectos del alojamiento, incluida la seguridad, el crecimiento y escala, la velocidad
y otras preocupaciones operativas, son manejados por el equipo de Pinecone, lo que significa
que puede estar en funcionamiento con un motor de búsqueda de similitudes en cuestión de
horas.

Aunque Zilliz próximamente va a lanzar una solución gestionada para la nube, en la forma de
Zillow Cloud, la compañía adopta el enfoque de núcleo abierto con una biblioteca de código
abierto llamada Milvus. Milvus está compuesto por bibliotecas de uso común como NMSLib y
FAISS, proporcionando una implementación simple de un motor de búsqueda vectorial con una
API expresiva y fácil de usar, que los desarrolladores pueden utilizar para construir y mantener
sus propios índices vectoriales.

Grid.ai

Grid.ai es una creación de las personas detrás de PyTorch Lightning, un popular marco, de alto
nivel y construido en PyTorch, que abstrae gran parte del texto estándar de PyTorch y facilita el
entrenamiento en uno o mil GPUs con un par de switches de parámetros. Grid.ai toma la
simplificación que trae PyTorch Lightning y se ejecuta con ella, lo que permite a los científicos
de datos entrenar sus modelos utilizando recursos de GPU transitorios, tan fácilmente como
ejecutar código localmente.

¿Quiere ejecutar un barrido de hiperparámetros en 200 GPUs a la vez? Grid.ai le permitirá hacer
eso, administrando todo el abastecimiento (y desmantelamiento) de los recursos de
infraestructura de fondo, asegurándose de que sus conjuntos de datos estén optimizados para
su uso a escala y proporcionando informes de métricas, todo incluido con una sencilla interfaz
de usuario web. También puede usar Grid.ai para poner en marcha instancias para el desarrollo
interactivo, ya sea en la consola o adjunto a un Jupyter Notebook.

Los esfuerzos de Grid.ai, para simplificar el entrenamiento de modelos a escala, serán útiles
para las empresas que necesitan desarrollar sesiones de entrenamiento que ocupen 100 o más
GPUs a la vez, pero queda por ver cuántos de esos clientes hay. Aun así, si necesita una línea de
capacitación optimizada para sus científicos de datos que minimice los costos de la nube,
definitivamente debe examinar de cerca a Grid.ai.

DataRobot

A DataRobot le gustaría ser dueño del ciclo de vida de la inteligencia artificial de su empresa
desde la preparación de los datos hasta la implementación de la producción, y la empresa
ofrece una buena propuesta. El pipeline de la preparación de datos de DataRobot tiene toda la
parafernalia, en términos de interfaz de usuario web, que esperaría que hiciera que el
enriquecimiento de datos fuera muy sencillo, además de que incluye instalaciones para ayudar
a los usuarios (novatos o expertos) mediante la creación automática de perfiles, agrupamientos
y limpieza de datos antes de ser introducidos en un modelo.

DataRobot tiene una función de aprendizaje automático automatizado que entrenará modelos
según sus objetivos, lo que le permitirá seleccionar el modelo generado con mejor rendimiento,
o uno de los suyos subido a la plataforma. Cuando se trata de implementación, el módulo
MLops integrado de la plataforma rastrea todo, desde el tiempo de actividad hasta la deriva de
datos, a medida que pasa el tiempo, para que siempre pueda ver el rendimiento de sus modelos
de un vistazo. También hay una función llamada Humble AI, que le permite poner barreras
adicionales en sus modelos en caso de que ocurran eventos de baja probabilidad en el momento
de la predicción y, por supuesto, estos también se pueden rastrear a través del módulo MLops.

Diferenciándose ligeramente de la mayoría de las otras empresas emergentes en esta lista,


DataRobot se instalará, sin sistema operativo, dentro de sus propios centros de datos y
clústeresde Hadoop, y también se implementará en productos de nube privada y administrada,
lo que demuestra que está decidida a competir, en todos los ámbitos, en las batallas que
vendrán dentro de la plataforma de inteligencia artificial empresarial en el futuro, atendiendo
a clientes desde startups hasta la empresas establecidas de Fortune 500.

MLops es una de las áreas más candentes de la inteligencia artificial en este momento, y la
necesidad de aceleradores, plataformas y administración, así como de monitoreo, solo
aumentará a medida que más empresas ingresen al campo de la inteligencia artificial. Si se está
uniendo a la fiebre del oro de la inteligencia artificial, ¡puede recurrir a estas cinco nuevas
empresas para que le proporcionen sus picos y hachas!

Basado en el artículo de Ian Pointer (InfoWorld) y editado por CIO Perú

También podría gustarte