OpenAI, en collaboration avec AMD, Broadcom, Intel, Microsoft et NVIDIA, a développé un nouveau protocole réseau open source pour optimiser les supercalculateurs d’IA.
Les supercalculateurs dédiés à l’intelligence artificielle sont confrontés à des goulots d’étranglement majeurs dans la transmission des données entre les GPU. Pour y remédier, cette alliance industrielle a conçu le protocole MRC (Multi-Rail Connectivity).
MRC permet d’envoyer des données simultanément sur des centaines de chemins entre les GPU. Cette approche réduit drastiquement le nombre de couches de commutation nécessaires, passant de trois ou quatre à seulement deux pour connecter plus de 100 000 GPU.
L’adoption de MRC entraîne une diminution significative de la consommation électrique et des coûts d’infrastructure. Ce protocole est déjà opérationnel au sein du supercalculateur Stargate d’OpenAI, démontrant son efficacité en conditions réelles. Cette initiative collaborative pourrait redéfinir l’architecture des infrastructures nécessaires au développement des intelligences artificielles de nouvelle génération.
Source : The Decoder