Un système de génération augmentée par récupération (RAG) fonctionnant dans le domaine juridique allemand rencontre des difficultés prévisibles malgré une bonne gestion de 80% des requêtes.
L’utilisateur, actif depuis plusieurs mois sur ce système, identifie trois schémas d’échec récurrents. Le premier concerne les questions nécessitant des informations éparpillées sur de nombreux documents, où la recherche vectorielle peine à connecter des éléments pertinents mais distincts.
Les deux autres limitations, non détaillées dans le résumé initial, soulignent les défis persistants pour déployer efficacement ces technologies dans des contextes professionnels complexes. Ces obstacles invitent à explorer de nouvelles approches pour améliorer la robustesse des systèmes RAG.
Source : Reddit r/MachineLearning