Un moteur d’inférence CUDA/C++ pour le modèle 3D de NVIDIA

Un développeur a conçu dvlt.cu, un moteur d’inférence pour le modèle 3D Transformer de NVIDIA, entièrement codé en CUDA/C++. Ce projet, né d’un intérêt pour le calcul haute performance et la reconstruction 3D, se distingue par sa légèreté et son indépendance vis-à-vis des bibliothèques courantes.

Le programme se présente sous la forme d’un unique exécutable de 5 Mo, sans dépendances majeures comme Python, PyTorch, TensorFlow, ONNX, ou les runtimes de Hugging Face. Il s’appuie uniquement sur cuBLASLt et cuTLASS, des composants optimisés pour les GPU NVIDIA.

Les poids du modèle (117 millions de paramètres), fournis par NVIDIA et destinés à un usage non commercial, sont chargés directement en mémoire GPU. Cette approche vise une efficacité maximale pour l’exécution du modèle.

Source : Reddit r/LocalLLaMA

Catégories : Brèves IA
← Article précédentChatbots intimes : des développeurs exploitent l'économie de la confianceArticle suivant →La levure produit un anticancéreux essentiel : vers des traitements plus accessibles

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES