Le système OCR « Illimité » de Baidu peut désormais traiter des dizaines de pages de documents en un seul passage, là où les systèmes précédents se limitaient à une dizaine.
Cette avancée est rendue possible par un mécanisme d’attention modifié. Celui-ci gère la mémoire du modèle en s’inspirant du processus d’oubli humain, permettant ainsi de maintenir une consommation de ressources stable, quelle que soit la quantité de pages traitées. Cette approche innovante résout un défi technique majeur.
Contrairement aux systèmes antérieurs qui plafonnaient à une dizaine de pages, l’OCR de Baidu peut désormais analyser des volumes de texte bien plus importants. Cette performance lui a valu la première place sur le benchmark le plus important en matière de reconnaissance optique de caractères.
Cette percée technologique pourrait transformer la gestion des archives numériques et l’automatisation du traitement documentaire à grande échelle.
Source : The Decoder