Un nouveau système de récupération sémantique nommé RAGless utilise l’appariement question-à-question pour améliorer la recherche dans les FAQ à domaine fermé.
Développé spécifiquement pour les systèmes de FAQ, RAGless se distingue par sa méthode d’ingestion. Un modèle de langage étendu (LLM) génère plusieurs variantes de questions (généralement 3 à 5) pour chaque réponse existante. Chaque variante est ensuite transformée en un encodage vectoriel unique.
Lorsqu’une requête utilisateur est soumise, elle est également encodée. Le système récupère les K variantes de questions les plus proches et agrège leurs scores par identifiant de réponse. La réponse associée au score agrégé le plus élevé est alors sélectionnée.
Pour garantir la pertinence, RAGless intègre une logique de seuil à deux niveaux. Une réponse est validée si son score agrégé dépasse un minimum (fixé par défaut à 0,70) ou si la meilleure variante individuelle atteint un certain seuil.
Cette approche vise à optimiser la précision de la récupération d’informations sans nécessiter de génération de texte en temps réel, contrairement aux systèmes RAG traditionnels. Cette méthode pourrait offrir une alternative efficace pour les applications nécessitant une récupération de réponses précises dans des corpus de connaissances bien définis.
Source : Reddit r/MachineLearning