OCR multilingue : le modèle Nemotron-OCR v2 améliore la reconnaissance de texte
Nemotron-OCR v2, un modèle OCR multilingue rapide et performant, est désormais disponible.
Nemotron-OCR v2, un modèle OCR multilingue rapide et performant, est désormais disponible.
NVIDIA lance GR00T, un modèle de langage visuel open-source pour robots humanoïdes.
La nouvelle variante Qwen3.6-35B-A3B « Uncensored Aggressive » est disponible, offrant un modèle linguistique sans aucune restriction de contenu ni perte de capacités.
Hugging Face facilite l’entraînement de modèles d’IA multimodaux avec Sentence Transformers.
Hugging Face intègre sa bibliothèque Transformers au framework MLX d’Apple pour une IA optimisée sur Mac.
Un mois après le lancement de sa v8 critiquée, Midjourney déploie la version 8.1 pour corriger l’esthétique, les performances et les tarifs.
Le modèle IA Qwen3.5-35b se révèle efficace pour créer des applications web complexes via des instructions textuelles.
IBM Research a lancé VAKRA, un benchmark évaluant la capacité des agents d’IA à raisonner et utiliser des outils, révélant leurs forces et faiblesses actuelles.
HCompany a lancé HoloTab, une extension de navigateur basée sur l’IA, conçue pour enrichir et personnaliser l’expérience de navigation web des utilisateurs.
Un ingénieur logiciel a investi dans une seconde machine Asus Ascent GX10 pour exécuter localement des modèles de langage avancés, une seule unité s’étant avérée insuffisante pour ses besoins.