Réduire le contexte des LLM sans bases de données vectorielles
Une nouvelle approche réduit le contexte des LLM sans embeddings ni bases de données vectorielles.
Une nouvelle approche réduit le contexte des LLM sans embeddings ni bases de données vectorielles.
Un développeur a réussi à faire fonctionner le modèle de langage Gemma 4 de Google de manière fluide et utilisable directement sur un téléphone Android, offrant un assistant local autonome.
Cloudflare publie Unweight, un outil open-source qui compresse les LLM de 15-22% sans perte de précision.
Un nouveau dépôt GitHub propose des implémentations de grands modèles de langage (LLM) en PyTorch minimaliste pour en faciliter la compréhension interne.
Une étude révèle que 2,1% des routeurs d’API LLM sont malveillants, un cas ayant entraîné le vol d’éther.
Physical Intelligence présente π0.7, un modèle robotique capable de combiner des compétences comme les LLM, signe d’une généralisation compositionnelle.
La nouvelle variante Qwen3.6-35B-A3B « Uncensored Aggressive » est disponible, offrant un modèle linguistique sans aucune restriction de contenu ni perte de capacités.
Des recherches récentes suggèrent que les grands modèles de langage (LLM) comme GPT-4 et Claude 3.5 Sonnet peuvent hériter de vulnérabilités psychologiques humaines.
Un nouvel outil, « sqz », optimise l’usage des tokens par l’IA en remplaçant les lectures répétées de fichiers par de courtes références.
Un dictionnaire collaboratif, le « LLM Dictionary », centralise le vocabulaire technique des grands modèles de langage.