Les IA reproduisent les biais du web, faute de données exhaustives - IA Actu

Les intelligences artificielles, à l’instar de ChatGPT, entraînées sur d’immenses volumes de données issues du web, héritent inévitablement des angles morts et des biais inhérents à Internet. L’« armée opaque des petits robots arpenteurs » qui nourrit ces IA dépend profondément du réseau mondial pour collecter la masse d’informations nécessaire à leur apprentissage et à leur fonctionnement.

Cette dépendance, bien que fondamentale pour l’entraînement des modèles, empêche ces systèmes de prétendre à une exhaustivité totale. De nombreuses pages web restent inaccessibles aux outils de collecte de données, soit par des restrictions techniques, soit par leur nature même, créant des lacunes significatives dans les corpus d’entraînement.

Par ailleurs, les informations effectivement agrégées ne représentent pas toujours fidèlement la diversité des cultures humaines. Cette asymétrie dans les données, où certaines perspectives sont surreprésentées et d’autres sous-représentées, conduit les modèles d’IA à reproduire et potentiellement amplifier les déséquilibres et les préjugés déjà présents sur le web. La question de la représentativité des données d’entraînement demeure ainsi un enjeu majeur pour le développement éthique et performant de l’intelligence artificielle.

Source : Le Monde Pixels

Restez informé de l'actualité IA

Laisser un commentaire Annuler

Rubriques

À propos

Légal

Mes sauvegardes