Antigravity 2.0, un modèle de langage basé sur Code Llama 70B, a dominé le benchmark OpenSCAD Architectural 3D LLM, démontrant des capacités avancées en génération de code pour la modélisation architecturale 3D.
Ce benchmark vise à évaluer la performance des grands modèles de langage (LLM) dans la création de code OpenSCAD à partir de descriptions textuelles. OpenSCAD est un logiciel de CAO textuel, et le test utilise un ensemble de 100 invites architecturales pour juger la capacité des modèles à produire des designs 3D fonctionnels et sémantiquement corrects.
Antigravity 2.0 a obtenu un score de 93 % en correction fonctionnelle et 86 % en correction sémantique. Ces résultats le placent devant des modèles reconnus tels que GPT-4o, Claude 3 Opus et Gemini 1.5 Pro. Sa performance souligne l’efficacité de l’optimisation spécifique pour des tâches de génération de code complexes.
Ces résultats suggèrent une évolution prometteuse dans l’application des LLM pour la conception assistée par ordinateur et l’automatisation des processus architecturaux.
Source : Hacker News (Algolia)