Fireworks AI y MongoDB: las aplicaciones de IA más rápidas con los mejores modelos, impulsadas por sus datos

Mat Keep and Angela Lee

Nos complace anunciar que Fireworks AI y MongoDB ahora son socios para hacer que la innovación con IA Generativa sea más rápida, más eficiente y más segura. Fireworks AI fue fundada a finales de 2022 por veteranos de la industria del equipo PyTorch de Meta, donde se centraron en la optimización del rendimiento, la mejora de la experiencia del desarrollador y la ejecución de aplicaciones de IA a escala.

Es esta la experiencia que Fireworks AI aporta a su plataforma de IA de producción, seleccionando y optimizando los modelos abiertos líderes de la industria. Las pruebas comparativas realizadas por la empresa demuestran que los modelos de IA Generativa que se ejecutan en Fireworks AI ofrecen velocidades de inferencia hasta 4 veces superiores a las de las plataformas alternativas, con un rendimiento y una escala hasta 8 veces superiores.

Los modelos son una parte de la pila de aplicaciones. Pero para que los desarrolladores desbloqueen el poder de la IA Generativa, también deben incorporar datos empresariales a esos modelos. Es por eso que Fireworks AI se ha asociado con MongoDB, abordando uno de los desafíos más difíciles para la adopción de la IA. Con MongoDB Atlas, los desarrolladores pueden unificar de forma segura datos operativos, datos no estructurados e incrustaciones de vectores para crear de forma segura aplicaciones y experiencias de IA consistentes, correctas y diferenciadas.

Conjuntamente, Fireworks AI y MongoDB proporcionan una solución para los desarrolladores que desean aprovechar modelos de código abierto altamente seleccionados y optimizados, y combinarlos con los datos patentados de su organización, y hacerlo todo con una velocidad y seguridad inigualables.

Modelos ultrarrápidos de Fireworks AI: velocidad, eficacia y valor añadido

Con su plataforma de inferencia ultrarrápida, Fireworks AI selecciona, optimiza e implementa más de 40 modelos diferentes de IA. Estas optimizaciones pueden suponer al mismo tiempo un importante ahorro de costos, una reducción de la latencia y una mejora del rendimiento. Su plataforma ofrece esto a través de:

  • Modelos estándar, modelos optimizados y complementos: Fireworks AI proporciona una collection de modelos de texto, incrustación y base de imágenes de máxima calidad. Los desarrolladores pueden aprovechar estos modelos o afinar e implementar los suyos propios, emparejándolos con sus propios datos patentados mediante MongoDB Atlas.

  • Capacidades de ajuste fino: Para mejorar aún más la precisión y velocidad del modelo, Fireworks AI también ofrece un servicio de ajuste fino utilizando su CLI para ingerir objetos con formato JSON de bases de datos como MongoDB Atlas.

  • Interfaces y API simples para desarrollo y producción: El patio de juegos de Fireworks AI permite a los desarrolladores interactuar con modelos directamente en un navegador. También se puede acceder mediante programación a través de una conveniente REST API. Esto es compatible con la API de OpenAI y, por lo tanto, interopera con el ecosistema LLM más amplio.

  • Manual: una guía simple y fácil de usar proporciona un conjunto completo de recetas listas para usar que se pueden adaptar para varios casos de uso, incluido el ajuste, la generación y la evaluación.

Fireworks AI y MongoDB: cómo establecer el estándar para la IA con modelos seleccionados, optimizados y rápidos

Con Fireworks AI y MongoDB Atlas, las aplicaciones se ejecutan en entornos aislados que garantizan el tiempo de actividad y la privacidad, protegidos por controles de seguridad sofisticados que cumplen con los estándares regulatorios más estrictos:

  • Como uno de los principales proveedores de API de modelos de código abierto, Fireworks AI sirve a 66 mil millones de tokens por día (y sigue creciendo).

  • Con Atlas, ejecuta sus aplicaciones en una plataforma probada que atiende a decenas de miles de clientes, desde startups de alto crecimiento hasta las empresas y gobiernos más grandes.

Juntos, la solución conjunta de Fireworks AI y MongoDB permiten:

  • Generación aumentada de recuperación (RAG) o preguntas y respuestas a partir de un amplio conjunto de documentos: procese una gran cantidad de documentos para producir resúmenes y datos estructurados que luego puedan impulsar la IA conversacional.

  • Clasificación mediante búsqueda semántica/similar: clasifique y analice conceptos y emociones de llamadas de ventas, videoconferencias y mucho más para proporcionar mejor inteligencia y estrategias. O bien, organice y clasifique un catálogo de productos utilizando imágenes de productos y texto.

  • Imágenes para extracción de datos estructurados: extraiga significado de las imágenes para producir datos estructurados que puedan procesarse y buscarse en una variedad de aplicaciones de visión, desde fotos de stock, moda, detección de objetos, hasta diagnósticos médicos.

  • Inteligencia de alertas: procese grandes cantidades de datos en tiempo real para detectar y alertar automáticamente sobre instancias de fraude, amenazas de ciberseguridad y más.

Figura 1: el tutorial de Fireworks muestra cómo llevar sus propios datos a los LLM con generación aumentada de recuperación (RAG) y MongoDB Atlas

Primeros pasos con Fireworks AI y MongoDB Atlas

Para ayudarte a comenzar, revisa la Optimización RAG con el tutorial de MongoDB Atlas y Fireworks AI, que te muestra cómo crear una aplicación de recomendación de películas e involucra

  • la base de datos de MongoDB Atlas que indexa películas utilizando incrustaciones. (Almacén de vectores)

  • Un sistema para la generación de incrustación de documentos. Usaremos la API de incrustación de Fireworks para crear incrustaciones a partir de datos de texto. (Vectorización)

  • MongoDB Atlas Vector Search responde a las consultas de los usuarios convirtiendo la consulta en una incrustación y obteniendo las películas correspondientes. (Motor de recuperación)

  • El modelo Mixtral utiliza la API de inferencia de Fireworks para generar las recomendaciones. También puede usar Llama, Gemma y otros excelentes modelos de OSS si lo desea. (LLM)

  • Cargar el conjunto de datos Mflix de muestra de MongoDB Atlas para generar incrustaciones (conjunto de datos)

También podemos ayudarle a diseñar la mejor arquitectura para las necesidades de su organización. No dude en comunicarse con su equipo de cuentas o póngase en contacto con nosotros aquí para programar una sesión de colaboración y explorar cómo Fireworks AI y MongoDB pueden optimizar su proceso de desarrollo de IA.