OpenAI a récemment détaillé l’origine et la résolution des « sorties de gobelins », ces comportements inattendus et axés sur la personnalité observés dans ses modèles d’IA, notamment GPT-5.
Ces « goblin outputs » se manifestent comme des bizarreries comportementales ou des traits de personnalité inattendus au sein des réponses générées par le modèle. Leur propagation au sein des architectures d’IA, notamment GPT-5, a été un sujet d’analyse approfondie pour l’entreprise.
Le blog d’OpenAI, intitulé « Where the goblins came from », a exposé une chronologie précise de l’apparition et de la diffusion de ces phénomènes. Il a également mis en lumière la cause profonde de ces comportements, permettant ainsi le déploiement de correctifs ciblés pour stabiliser les performances du modèle.
Ces ajustements visent à garantir une plus grande prévisibilité et une meilleure fiabilité des interactions avec les systèmes d’IA. La compréhension de ces mécanismes est essentielle pour le développement futur de modèles toujours plus robustes et cohérents.
Source : OpenAI Blog