L’entraînement des intelligences artificielles pourrait être freiné dès 2026 en raison d’une pénurie imminente de texte humain de qualité sur le web.
Cette dépendance des IA à une ressource peu surveillée, les données humaines, est désormais au cœur des préoccupations. Des chercheurs estiment que le corpus de texte de haute qualité disponible sur internet s’épuisera dans les prochaines années, potentiellement dès 2026. Cette raréfaction des données textuelles humaines pourrait sérieusement limiter la capacité des futurs modèles d’IA à apprendre et à progresser de manière significative.
Alors que cette perspective soulève des questions sur la durabilité de l’innovation en IA, certains pays prennent les devants. La Chine, par exemple, met en œuvre un plan ambitieux pour produire le « carburant » nécessaire à l’entraînement de ses propres modèles, anticipant ainsi la future pénurie mondiale de données.
La gestion et la création de nouvelles sources de données de qualité deviennent ainsi un défi majeur pour l’avenir de l’intelligence artificielle.
Source : Science et Vie