Une équipe de LabLab AI a démontré la faisabilité de l’entraînement d’un modèle d’intelligence artificielle clinique, MedQA, sur l’architecture ROCm d’AMD, offrant une alternative concrète à l’écosystème CUDA de NVIDIA.
Historiquement, le développement et le déploiement de l’IA s’appuient majoritairement sur les GPU NVIDIA et leur plateforme logicielle CUDA. Cette dépendance a souvent limité les options matérielles pour les chercheurs et les entreprises. Le projet, issu d’un hackathon AMD Developer, met en lumière la capacité des puces AMD à gérer des tâches d’apprentissage profond complexes.
L’équipe a spécifiquement réussi à affiner un modèle MedQA de 7 milliards de paramètres sur un GPU AMD Instinct MI210. Cette prouesse technique, réalisée sans nécessiter CUDA, ouvre la voie à une diversification des infrastructures matérielles pour l’IA. Elle suggère que les développeurs peuvent désormais envisager les GPU AMD pour des applications exigeantes, y compris dans des domaines spécialisés comme la santé.
L’utilisation de ROCm, la plateforme logicielle open source d’AMD, pourrait réduire la dépendance vis-à-vis d’un unique fournisseur et potentiellement démocratiser l’accès aux ressources de calcul haute performance. Cette initiative favorise la compétition et l’innovation au sein de l’écosystème matériel de l’IA.
Cette avancée pourrait influencer les futures décisions d’investissement et de développement pour les infrastructures d’IA à l’échelle mondiale.
Source : HuggingFace Blog