Phosphene, un panneau de bureau gratuit et open source, permet désormais la génération locale de vidéos et d’audio sur les Mac équipés de puces Apple Silicon.
Cette application intègre le modèle LTX 2.3 de Lightricks, conçu pour fonctionner nativement sur le framework MLX d’Apple. Elle offre ainsi une solution optimisée pour l’écosystème Mac, avec une installation simplifiée via Pinokio, rendant la technologie accessible aux utilisateurs.
La principale innovation de Phosphene réside dans sa capacité à générer simultanément vidéo et audio. Le modèle LTX 2.3 réalise cette prouesse en une seule passe de diffusion, ce qui assure une synchronisation intrinsèque entre les éléments visuels et sonores.
Cette approche garantit une cohérence temporelle remarquable : les bruits de pas s’alignent précisément sur les mouvements, les lèvres correspondent aux dialogues, et l’ambiance sonore est directement conditionnée par le contenu visuel. Cette intégration native représente une avancée significative pour la création de contenu multimédia immersif et réaliste.
L’émergence de tels outils sur des plateformes grand public ouvre de nouvelles voies pour l’expérimentation et la production de contenu assistée par l’IA.
Source : Reddit r/MachineLearning