Un nouveau framework de Récupération Augmentée par Génération (RAG) multi-sauts, nommé MOTHRAG, a été dévoilé. Ce système se distingue en réalisant une récupération d’informations complexe sans nécessiter la construction préalable d’un graphe de connaissances, surpassant même les systèmes basés sur des graphes sur le benchmark HotpotQA.
Jusqu’à présent, les approches les plus performantes pour le RAG multi-sauts, telles que GraphRAG, HippoRAG ou RAPTOR, s’appuyaient sur des graphes de connaissances élaborés hors ligne. Cette dépendance pose un défi majeur : chaque modification du corpus de données exige une lourde passe d’indexation par un grand modèle de langage (LLM) pour reconstruire entièrement le graphe.
Cette contrainte rend ces systèmes coûteux et peu pratiques pour des corpus de données qui évoluent quotidiennement, comme les prix, les documents internes, les tickets de support ou les actualités. MOTHRAG contourne cette limitation en orchestrant la récupération multi-sauts directement au moment de la requête, offrant ainsi une flexibilité accrue face aux données dynamiques.
Cette innovation pourrait réduire significativement les frais opérationnels et étendre l’applicabilité des systèmes RAG à des environnements où l’information est en constante évolution.
Source : Reddit r/MachineLearning