Performance record : 1000 tps avec Qwen3.6 27B sur V100
Un utilisateur Reddit a atteint 1000 tokens par seconde avec le modèle Qwen3.6 27B sur des GPU V100, démontrant un potentiel d’optimisation significatif.
Un utilisateur Reddit a atteint 1000 tokens par seconde avec le modèle Qwen3.6 27B sur des GPU V100, démontrant un potentiel d’optimisation significatif.
Alibaba devient plus sélectif dans le partage de ses modèles d’IA, privilégiant désormais ses créations propriétaires.