Un moteur LLM 1-bit en Rust atteint des performances inédites sur CPU Edge
Un développeur a conçu un moteur d’inférence de LLM 1-bit en Rust, offrant 150+ TPS et 350 Mo de mémoire sur des CPU périphériques.
Un développeur a conçu un moteur d’inférence de LLM 1-bit en Rust, offrant 150+ TPS et 350 Mo de mémoire sur des CPU périphériques.
ChatGPT mémorise désormais des informations sur vous sous forme de dossiers narratifs organisés.
Une discussion sur Reddit, s’appuyant sur un article de Google, met en lumière la distinction cruciale entre la calibration et la justesse des LLM, essentielle pour les agents autonomes.
Sam Altman, PDG d’OpenAI, annonce une nouvelle ère pour l’IA : des systèmes proactifs agissant en autonomie.
Les systèmes judiciaires américains sont confrontés à une augmentation des plaintes rédigées ou assistées par l’intelligence artificielle, posant de nouveaux défis.
Jeff Bezos investit 500 millions de dollars dans Flourish, une initiative ambitieuse visant à décrypter l’algorithme fondamental du cerveau humain pour réinventer l’IA.
xAI a mis à jour son modèle Grok Imagine vers la version 1.5, introduisant la génération de vidéo à partir d’images fixes avec une résolution de 720p.
Le modèle d’IA Gemma 4 12B de Google est disponible pour une installation locale, suscitant des débats sur ses performances réelles.
La communauté ML débat du principal goulot d’étranglement pour le progrès : la qualité des données ou les architectures de modèles, alors que l’accent est mis sur la curation des jeux de données.
Ideogram 4.0 est lancé comme un modèle open-weight avec résolution 2K native et rendu de texte amélioré, se classant premier parmi les modèles ouverts sur DesignArena.