Nvidia a rendu disponibles les modèles Kimi-K2.6-NVFP4 et Kimi-2.5. Le Kimi-K2.6-NVFP4 est une version quantifiée du modèle Kimi-K2.6 de Moonshot AI, un modèle de langage autorégressif basé sur une architecture Transformer optimisée.
Ces modèles, quantifiés via Model Optimizer, sont prêts pour un usage commercial et non commercial. Les résultats des benchmarks de précision, incluant GPQA, Diamond, SciCode, τ²-Bench, Telecom, MMMU Pro, AA-LCR et IFBench, sont disponibles pour évaluation.
La publication de ces modèles quantifiés par Nvidia facilite leur déploiement et leur utilisation dans diverses applications d’intelligence artificielle, ouvrant la voie à de nouvelles expérimentations et intégrations.
Source : Reddit r/LocalLLaMA