LightOn redéfinit les standards de la recherche d'information complexe avec GTE-ModernColBERT.

Levier d'innovation clé pour les entreprises, les IA génératives sont confrontées à la complexité et la spécificité des données internes aux organisations. Aujourd'hui LightOn annonce la sortie de GTE...

Levier d'innovation clé pour les entreprises, les IA génératives sont confrontées à la complexité et la spécificité des données internes aux organisations. Aujourd'hui LightOn annonce la sortie de GTE-ModernColBERT, un modèle dédié à la recherche d'information redéfinissant les standards de l'industrie par sa gestion des documents longs et sa capacité de généralisation sur données complexes inconnues. Ce nouveau modèle surclasse ceux des acteurs de l'écosystème (Alibaba, Cohere, Snowflake, BAAI, JinaAI) sur le benchmark de référence LongEmbed.

Une innovation majeure pour la recherche documentaire

GTE-ModernColBERT, est le premier modèle d'"interaction tardive", multi-vecteurs de pointe, entièrement développé grâce à l'architecture ModernBERT et la bibliothèque PyLate.

Jusqu'ici, la plupart des solutions de génération par recherche augmentée (Retrieval Augmented Generation - RAG) reposaient sur des modèles à vecteur unique. Modèles de références pour un usage courant, ils tendent à montrer des limites dès qu'il s'agit de traiter des contextes longs ou des bases documentaires spécialisées, comme c'est le cas des entreprises et établissements publics qui manipulent des volumes massifs et hétérogènes de données nouvelles...

Société(s) citée(s) :
Société(s) citée(s) :