La société française Mistral AI a dévoilé OCR 4, un nouveau modèle d’intelligence artificielle spécialisé dans la reconnaissance optique de caractères (OCR). Ce système est conçu pour extraire du texte à partir de divers formats de documents, incluant les fichiers PDF, Word et PowerPoint.
Selon l’entreprise, OCR 4 aurait surpassé ses concurrents dans 72 % des cas lors de tests à l’aveugle. Ces performances suggèrent une amélioration notable dans la capacité des modèles d’IA à interpréter et à transcrire fidèlement le contenu textuel des documents numérisés ou numériques.
Cette avancée pourrait avoir des répercussions sur les outils de gestion documentaire et d’automatisation des processus, en facilitant l’accès et le traitement des informations contenues dans de vastes corpus de documents. L’évolution de ces technologies soulève la question de leur intégration future dans les flux de travail professionnels.
Source : The Decoder