Un moteur d’inférence CUDA/C++ pour le modèle 3D de NVIDIA
Un nouveau moteur d’inférence en CUDA/C++ pour le modèle 3D Transformer de NVIDIA a été développé, sans dépendances lourdes.
Un nouveau moteur d’inférence en CUDA/C++ pour le modèle 3D Transformer de NVIDIA a été développé, sans dépendances lourdes.
Un nouveau compilateur « hackable » pour modèles d’IA a été développé, promettant des gains de performance significatifs sur GPU face aux solutions existantes comme PyTorch.
La plateforme logicielle CUDA est le pilier de la domination d’Nvidia dans l’IA, créant une barrière concurrentielle plus forte que son matériel.
Une équipe de LabLab AI a démontré la faisabilité de l’entraînement d’un modèle d’IA clinique, MedQA, sur l’architecture ROCm d’AMD, offrant une alternative concrète à l’écosystème CUDA de NVIDIA.
Un compilateur d’IA simplifié en 5 000 lignes de Python offre une approche pédagogique face à la complexité des outils actuels.
TurboOCR optimise PaddleOCR avec TensorRT pour atteindre jusqu’à 1200 images/seconde en reconnaissance optique de caractères.