Mirage de Microsoft Research : une mémoire spatiale persistante pour la vidéo
Microsoft Research a développé Mirage, un modèle mondial de vidéo qui stocke les informations de scène dans un espace latent pour une cohérence spatiale accrue.
Microsoft Research a développé Mirage, un modèle mondial de vidéo qui stocke les informations de scène dans un espace latent pour une cohérence spatiale accrue.
xAI a mis à jour son modèle Grok Imagine vers la version 1.5, introduisant la génération de vidéo à partir d’images fixes avec une résolution de 720p.
Hugging Face a détaillé une méthode d’affinement de NVIDIA Cosmos Predict 2.5, utilisant LoRA/DoRA, pour améliorer la génération de vidéos simulant des interactions robotiques.
Phosphene, un outil open source, permet la génération locale de vidéos et d’audio synchronisés sur les Mac équipés de puces Apple Silicon, via le modèle LTX 2.3.