Benchmarks - IA Actu - Actualité Intelligence Artificielle

Papers with Code lance une page dédiée à la robotique

16 juillet 2026

Papers with Code a inauguré une section dédiée à la robotique, centralisant les benchmarks majeurs, les articles avec code et les ressources open-source.

Évaluation de Gemma 2 9B auto-hébergé : impact de la quantification FP8 sur NVIDIA L4

27 juin 2026

Une étude compare les performances de Gemma 2 9B auto-hébergé sur une NVIDIA L4 aux API cloud, analysant l’impact de la quantification FP8 et la VRAM.

Les benchmarks d’IA ne prédisent pas toujours la robustesse en production

22 mai 2026

La performance des benchmarks d’IA ne reflète pas toujours la robustesse des systèmes face aux complexités du monde réel et aux usages en production.

GPT-5.5 : performances accrues mais hallucinations persistantes

24 avril 2026

GPT-5.5 domine les benchmarks d’IA mais conserve des hallucinations et coûte 20% de plus via l’API.

MemPalace : des scores parfaits nuancés par ses propres benchmarks

7 avril 20267 avril 2026

Le projet open-source MemPalace a fait sensation avec des scores de performance élevés, mais ses propres documents révèlent une nuance importante.

Rubriques

À propos

Légal

Mes sauvegardes