Une carte sémantique interactive explore 10 millions d’articles scientifiques

Un développeur a créé une carte sémantique interactive regroupant les dix millions d’articles scientifiques les plus récents, offrant une nouvelle approche pour explorer le paysage de la recherche.

Cette initiative vise à simplifier la navigation au sein de la littérature scientifique foisonnante. Pour construire cette carte, l’auteur a utilisé les dix millions de publications les plus récentes issues d’OpenAlex. Les titres et résumés de ces articles ont été traités pour générer des plongements sémantiques (embeddings) via le modèle SPECTER 2.

La réduction de la dimensionnalité a ensuite été effectuée avec UMAP, avant l’application d’un partitionnement de Voronoï sur les pics de densité pour délimiter des « quartiers » sémantiques distincts. La carte intègre des étiquettes de sujets flottantes, bien que leur génération soit encore en cours d’amélioration, et permet également la recherche par mots-clés.

Cet outil propose ainsi une exploration spatiale des connaissances, facilitant la découverte de liens et de domaines de recherche.

Source : Reddit r/MachineLearning

Catégories : Brèves IA
← Article précédentOpenAI : les mathématiques, nouveau baromètre de l'IA généraleArticle suivant →Google Search : les requêtes atteignent un record historique grâce à l'IA

Restez informé de l'actualité IA

Recevez chaque semaine notre sélection des meilleures analyses sur l'intelligence artificielle.

Pas de spam. Désinscription en un clic.

Laisser un commentaire

FR EN ES