Alors que le débat sur l’IA embarquée se concentre sur les grands modèles de langage locaux, des applications pratiques de vision par ordinateur, ne nécessitant pas de modèles massifs, sont déjà réalisables sur les smartphones actuels.
Un développeur a ainsi conçu et publié une fonctionnalité Android capable de reconnaître le code Morse, manuscrit ou imprimé, à partir d’images et de flux vidéo en direct, le tout entièrement hors ligne. Cette solution combine des techniques légères d’apprentissage automatique et de vision par ordinateur.
Cette démonstration suggère que le potentiel des modèles d’IA plus petits et optimisés pour le traitement local pourrait être largement sous-évalué pour des usages quotidiens et spécialisés.
Source : Reddit r/MachineLearning