Injection de personnalité LLM : les déclarations à la première personne plus efficaces - IA Actu

Une expérimentation menée par un chercheur indépendant a révélé que les déclarations à la première personne sont les plus efficaces pour injecter une personnalité spécifique, comme celle de C-3PO, dans les grands modèles de langage (LLM). Cette étude visait à déterminer le format de données d’entraînement optimal pour l’intégration de persona.

Trois formats ont été testés sur un même modèle avec une configuration LoRA identique et 500 exemples chacun : des démonstrations de chat, des déclarations à la première personne (« Je suis C-3PO… ») et des documents synthétiques de style Wikipédia.

Contre toute attente, les déclarations à la première personne ont démontré une meilleure généralisation de la personnalité. Le modèle entraîné avec des documents synthétiques a produit les résultats les plus singuliers : bien qu’il « connaisse » l’anxiété de C-3PO, il ne l’a exprimée que dans 37% des cas.

Cela suggère une distinction entre la connaissance d’un trait et sa manifestation effective dans l’espace des poids du modèle, ouvrant des pistes de réflexion sur la complexité de l’apprentissage des comportements. Cette recherche, dont le code est disponible sur GitHub, offre des perspectives précieuses pour l’amélioration de la fidélité des personnalités injectées dans les futurs LLM.

Source : Reddit r/MachineLearning

Restez informé de l'actualité IA

Laisser un commentaire Annuler

Rubriques

À propos

Légal

Mes sauvegardes