Dottxt, un ecosistema y plataforma con sede en París para interactuar con grandes modelos lingüísticos (LLM), ha recaudado 11,9 millones de dólares (aproximadamente 10,97 millones de euros) en financiación whole a través de rondas previas y iniciales completadas en poco más de siete meses.
La financiación se divide en una ronda inicial de 3,2 millones de dólares liderada por Elaia en diciembre de 2023 y una ronda inicial de 8,7 millones de dólares liderada por EQT Ventures en agosto de 2024.
Los inversores incluyen Seedcamp, Widespread Magic, Kima, FSJ, Roxanne Varza (Station F), Erik Bernhardsson (CEO de Modal Labs), Julien Chaumond (CTO de Hugging Face), Bob van Luijt (CEO de Weaviate) y Jean-Louis Queguiner ( Gladia, directora ejecutiva).
Julien Hobeika, socio de EQT Ventures, cube: “Desde nuestra primera conversación con Dottxt, vimos su potencial para convertir la naturaleza estocástica de los LLM en algo más programático y determinista, permitiendo una integración profunda en los sistemas de software program”.
“Esto se alinea con nuestra creencia de que el futuro de los agentes de IA estará determinado por aquellos que puedan construir los marcos esenciales que hagan que los LLM sean realmente utilizables a escala en sistemas empresariales críticos. Estamos entusiasmados de apoyar a Dottxt mientras lideran la creación de esta infraestructura crítica”.
Hacer que la IA hable con las computadoras
Dottxt mejora los modelos de lenguajes grandes (LLM) al permitir a los usuarios solicitar información estructurada, lo que hace que los LLM sean más que simples herramientas conversacionales. Esta actualización permite una integración perfecta con los ecosistemas digitales, transformando los LLM en recursos computacionales confiables.
Los científicos de datos pueden realizar consultas a bases de datos en lenguaje pure con precisión, mientras que los profesionales de recursos humanos pueden filtrar los CV según calificaciones específicas. Además, los usuarios pueden extraer rápidamente los atributos deseados de grandes bancos de imágenes, agilizando los flujos de trabajo y ahorrando tiempo en diversas industrias.
Los cofundadores Rémi Louf, Dan Gerlanc y Brandon Willard, que han colaborado durante más de cuatro años, desarrollaron Dottxt mientras trabajaban en la empresa de inteligencia synthetic Regular Computing, con sede en Nueva York. Encontraron desafíos con GPT-4, particularmente en la sistematización de la extracción de datos para evitar el trabajo guide. Aprovechando su experiencia en modelado estadístico y tecnología de compilación, idearon una solución que nadie más había encontrado.
En sólo un año, la biblioteca de código abierto de Dottxt, Outlines, ha obtenido más de 3 millones de descargas, incluidas 600.000 el mes pasado. Lo utilizan en producción empresas de todos los tamaños, y los principales actores de la IA, como OpenAI y Cohere, se encuentran entre los primeros en adoptarlo.
Utilización del capital
Los fondos se utilizarán para ampliar el equipo de Dottxt, aumentar el número de ingenieros de software program y contratar un jefe de private. El equipo, actualmente de nueve miembros, ha agregado seis nuevos empleados para centrarse en ampliar el alcance de la tecnología y distribuirla a empresas y desarrolladores.
Rémi Louf, CEO de Dottxt, afirma: “Dentro de unos años todo el mundo utilizará la generación estructurada, de eso no hay duda. Los proveedores de modelos, incluido OpenAI, están rezagados en términos de velocidad y capacidades, y estamos aquí para llenar ese vacío”.
“Con estos fondos, seguiremos superando los límites de esta tecnología y haciéndola más disponible para todos. Estamos dando forma a un futuro en el que la IA generativa cumple con el tipo de automatización que nos prometieron”.
¿Qué tienen que decir los inversores?
Clement Vanden Driessche, director de inversiones de Elaia, afirma: “En una nueva period del software program liderada por la aparición de agentes de IA, los desarrolladores experimentan con una fuerte necesidad de limitar el comportamiento de los modelos LLM para hacer que las aplicaciones finales sean más rápidas, robustas y confiables. “
“En Elaia estamos orgullosos de apoyar al equipo de Dottxt, desde sus inicios e incluso antes, que desarrolló una tecnología propia inspirada en los compiladores. Estamos emocionados de verlos crecer en el ecosistema de código abierto con una increíble adopción por parte de los desarrolladores hasta la fecha”.
Sia Houchangnia, socia de Seedcamp, añade: “Los LLM ya tienen el potencial de generar un valor tremendo, pero su falta de confiabilidad ha sido la barrera clave para una adopción más amplia. Dottxt resuelve este problema”.
“Al aplicar su experiencia en estadística bayesiana, Remi, Brandon, Dan y su equipo han creado la plataforma más precisa y de alto rendimiento para la generación estructurada. Estamos orgullosos de respaldar a la empresa desde el primer día y estamos convencidos de que Dottxt tiene el potencial de convertirse en el marco predeterminado para la programación LLM”.