DeepSeek V4 : L’article complet révèle l’entraînement FP4 QAT
DeepSeek a publié la version complète de son article V4, détaillant l’entraînement avec quantification consciente (QAT) en FP4 pour une efficacité accrue.
DeepSeek a publié la version complète de son article V4, détaillant l’entraînement avec quantification consciente (QAT) en FP4 pour une efficacité accrue.
La plateforme OpenRouter a annoncé une hausse de 50 % des tarifs de son modèle « GPT-5.5 » à partir du 20 novembre 2024, en raison de coûts d’exploitation plus élevés que prévu.
JobTeaser propose aux étudiants européens d’être rémunérés pour entraîner et évaluer les grands modèles d’IA américains.
Des chercheurs du MIT ont identifié la superposition comme le phénomène clé expliquant la fiabilité de la mise à l’échelle des performances des grands modèles de langage.
Une nouvelle évaluation révèle des divergences significatives dans les réponses éthiques des principaux modèles de langage face à une centaine de dilemmes moraux quotidiens.
Un nouveau routeur IA, Followloop, achemine intelligemment les requêtes vers les modèles les plus économiques, réduisant les coûts.
La version 4.7 du modèle Opus consomme plus de tokens que la 4.6 en raison d’une tokenisation et d’une réflexion plus intenses, augmentant le coût d’usage.
OpenAI clarifie une consigne étonnante de ses IA : ne pas mentionner les « gobelins » et autres créatures.
OpenAI a détaillé l’origine et la résolution des « sorties de gobelins », des comportements inattendus et axés sur la personnalité dans GPT-5.
Hugging Face intègre DeepInfra pour optimiser le déploiement et l’accès aux grands modèles de langage.