ocr - IA Actu - Actualité Intelligence Artificielle

L’OCR « Illimité » de Baidu traite des dizaines de pages en un seul passage

5 juillet 2026

Le système OCR « Illimité » de Baidu peut désormais traiter des dizaines de pages de documents en un seul passage, surpassant les limites des systèmes précédents.

Mistral OCR 4 : L’intelligence documentaire sémantique

26 juin 2026

Mistral AI a dévoilé OCR 4, la quatrième version de son modèle de reconnaissance optique de caractères, qui évolue vers le parsing documentaire sémantique pour les pipelines de recherche et le RAG.

OCR : une plateforme centralise les modèles open-source

24 juin 2026

Papers with Code centralise les meilleurs modèles OCR open-source, avec les récentes contributions de Baidu et Mistral.

Mistral AI lance un modèle OCR performant pour la lecture de documents

24 juin 2026

Mistral AI présente OCR 4, un modèle OCR qui se distingue par ses performances dans la lecture de divers formats de documents.

PP-OCRv6 : l’OCR multilingue de PaddlePaddle arrive sur Hugging Face

22 juin 2026

La nouvelle version PP-OCRv6 de PaddlePaddle est désormais disponible sur Hugging Face, offrant une reconnaissance optique de caractères (OCR) pour 50 langues.

Implémentation C++ de PaddleOCR : Déploiement simplifié avec ncnn

13 juin 2026

Une nouvelle implémentation en C++ des modèles PaddleOCR (v3 à v6) utilise ncnn pour simplifier le déploiement et améliorer les performances par rapport au runtime officiel.

LLM visuels et OCR : performances comparées sur les documents longs

24 mai 2026

Une étude comparative révèle que les LLM visuels surpassent légèrement les pipelines basés sur l’OCR pour la lecture de documents longs et complexes, mais à un coût plus élevé.

PaddleOCR 3.5 adopte les Transformers pour l’OCR et l’analyse documentaire

18 mai 2026

La nouvelle version 3.5 de PaddleOCR intègre une architecture Transformers, améliorant significativement ses capacités de reconnaissance optique de caractères et d’analyse de documents.

OCR : des LLM plus anciens et moins chers souvent plus performants

23 avril 2026

Une étude comparative de 18 grands modèles de langage pour l’OCR révèle que des modèles plus anciens ou moins coûteux surpassent fréquemment les plus récents.

OCR multilingue : le modèle Nemotron-OCR v2 améliore la reconnaissance de texte

17 avril 2026

Nemotron-OCR v2, un modèle OCR multilingue rapide et performant, est désormais disponible.

Rubriques

À propos

Légal

Mes sauvegardes