Les IA reproduisent les biais du web, faute de données exhaustives

Les intelligences artificielles, à l’instar de ChatGPT, entraînées sur d’immenses volumes de données issues du web, héritent inévitablement des angles morts et des biais inhérents à Internet. L’« armée opaque des petits robots arpenteurs » qui nourrit ces IA dépend profondément du réseau mondial pour collecter la masse d’informations nécessaire à leur apprentissage et à leur fonctionnement.

Cette dépendance, bien que fondamentale pour l’entraînement des modèles, empêche ces systèmes de prétendre à une exhaustivité totale. De nombreuses pages web restent inaccessibles aux outils de collecte de données, soit par des restrictions techniques, soit par leur nature même, créant des lacunes significatives dans les corpus d’entraînement.

Par ailleurs, les informations effectivement agrégées ne représentent pas toujours fidèlement la diversité des cultures humaines. Cette asymétrie dans les données, où certaines perspectives sont surreprésentées et d’autres sous-représentées, conduit les modèles d’IA à reproduire et potentiellement amplifier les déséquilibres et les préjugés déjà présents sur le web. La question de la représentativité des données d’entraînement demeure ainsi un enjeu majeur pour le développement éthique et performant de l’intelligence artificielle.

Source : Le Monde Pixels

Catégories : Brèves IA
← Article précédentLe Royaume-Uni envisage des frappes létales autonomes par IAArticle suivant →Une IA résout une énigme mathématique vieille de 80 ans

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES