par LIGHTON
LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTEModernColBERT.
LIGHTON
Communiqué de presse Paris, le 7 mai 2025 LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTE-ModernColBERT.
Paris, le 7 mai 2025 — Levier d’innovation clé pour les entreprises, les IA génératives sont confrontées à la complexité et la spécificité des données internes aux organisations. Aujourd’hui LightOn annonce la sortie de GTE-ModernColBERT, un modèle dédié à la recherche d’information redéfinissant les standards de l’industrie par sa gestion des documents longs et sa capacité de généralisation sur données complexes inconnues. Ce nouveau modèle surclasse ceux des acteurs de l’écosystème (Alibaba, Cohere, Snowflake, BAAI, JinaAI) sur le benchmark de référence LongEmbed. Une innovation majeure pour la recherche documentaire.GTE-ModernColBERT, est le premier modèle d’«interaction tardive», multi-vecteurs de pointe, entièrement développé grâce à l’architecture ModernBERT et la bibliothèque PyLate. Jusqu’ici, la plupart des solutions de génération par recherche augmentée (Retrieval Augmented Generation - RAG) reposaient sur des modèles à vecteur unique. Modèles de références pour un usage courant, ils tendent à montrer des limites dès qu’il s’agit de traiter des contextes longs ou des bases documentaires spécialisées, comme c’est le cas des entreprises et établissements publics qui manipulent des volumes massifs et hétérogènes de données nouvelles. Une capacité de généralisation hors norme pour les longs documents. GTE-ModernColBERT établit une nouvelle référence (SOTA — State of the Art) sur la généralisation avec contextes longs. Il surpasse de 10 points les meilleurs modèles (benchmark LongEmbed) sur des documents allant jusqu'à 32 000 tokens, soit des textes de plusieurs dizaines de pages, alors même qu’il n’a été initialement entraîné que sur des extraits de 300 tokens issus du jeu de données MS MARCO. Ces premiers tests montrent que GTE-ModernColBERT pourrait étendre ses capacités de manière encore plus ambitieuse, offrant d’excellentes performances même au-delà de cette fenêtre contextuelle.
Démocratiser le déploiement du Retrieval Augmented Generation (RAG) en entreprise.GTE-ModernColBERT transforme en profondeur la manière dont les organisations peuvent déployer la génération augmentée par recherche d’information (Retrieval-Augmented Generation, RAG) en :
Un impact concret.Les équipes de gestion des bases documentaires et les développeurs de solutions IA disposent désormais d’un socle robuste pour bâtir des services d’information de nouvelle génération. GTE-ModernColBERT se révèle particulièrement puissant pour:
Savoir-faire technologique de LightOn.LightOn a développé GTE-ModernColBERT en construisant une solution unique à partir d’éléments clés :
Engagement pour l’open source et la souveraineté technologiqueAprès la sortie de ModernBERT et ModernBERT-embed, la publication de GTE-ModernColBERT en open source illustre l’engagement continu de LightOn pour l’avancement de l’IA, tout en permettant à des organisations de toutes tailles de bénéficier des technologies de recherche de pointe et en favorisant la recherche grâce à la mise à disposition libre de PyLate. Pour les organisations souhaitant rester à la pointe de la gestion de la connaissance et du RAG, GTE-ModernColBERT est désormais disponible. Testez-le et (re)découvrez la valeur cachée de vos documents ! ð¯ Essayez-le dès aujourd’hui sur HuggingFace
À propos de LightOn Fondée en 2016 à Paris et première société européenne de l’IA Générative cotée sur Euronext Growth, LightOn est un acteur pionnier dans le domaine de la GenAI souveraine. Sa plateforme Paradigm permet aux organisations de déployer des IA à grande échelle, tout en garantissant la confidentialité de leurs données. La technologie de LightOn assure une indépendance stratégique essentielle, offrant ainsi des solutions sur mesure. Cette maîtrise technologique s’accompagne d’une capacité à traiter d’importants volumes de données pour des usages industriels, avec des applications dans des secteurs variés tels que la finance, l’industrie, la santé, la défense et les services publics. LightOn est cotée sur Euronext Growth® Paris (ISIN : FR0013230950, mnémonique : ALTAI-FR). La société est éligible au PEA et au PEA PME, et est qualifiée « Entreprise innovante » par Bpifrance. Pour en savoir plus : https://www.lighton.ai/fr
Contacts
Fichier PDF dépôt réglementaire Document : ModernColBERT FR |
Langue : | Français |
Entreprise : | LIGHTON |
2 rue de la Bourse | |
75002 Paris | |
France | |
E-mail : | contact@lighton.ai |
Internet : | www.lighton.ai |
ISIN : | FR0013230950 |
Ticker Euronext : | |
Catégorie AMF : | Informations privilégiées / Autres communiqués |
EQS News ID : | 2132500 |
Fin du communiqué | EQS News-Service |
2132500 07-Mai-2025 CET/CEST