dimanche, juillet 27

Alibaba lance Qwen3-Coder, son nouveau modèle IA open source pour le codage autonome

Alibaba a lancé Qwen3-Coder, son modèle d’IA de codage agentique le plus avancé à ce jour. Conçu pour le développement logiciel haute performance, Qwen3-Coder excelle dans les tâches de codage agentique, allant de la génération de nouveau code et la gestion de flux de travail complexes, jusqu’à l’analyse et la correction d’erreurs dans des bases de code complètes.

Construit sur une architecture Mixture-of-Experts (MoE), le modèle open source Qwen3-Coder-480B-A35B-Instruct, qui totalise 480 milliards de paramètres mais n’en active que 35 milliards par jeton, allie efficacité et performance. Il obtient des résultats compétitifs face aux modèles state-of-the-art (SOTA) les plus avancés, selon les principaux benchmarks en codage agentique, navigation web et utilisation d’outils.

Alibaba publie également en open source Qwen Code, un outil en ligne de commande (CLI) qui permet aux développeurs de déléguer des tâches techniques à l’IA via le langage naturel. Optimisé grâce à des prompts personnalisés et des protocoles d’interaction dédiés, Qwen Code active l’ensemble des fonctionnalités de Qwen3-Coder pour la programmation agentique en conditions réelles. Ce modèle est également compatible avec l’interface Claude Code, facilitant l’exécution des tâches de codage pour les développeurs.

Entraîné sur un vaste ensemble de données comprenant du code et du texte général, Qwen3-Coder a été conçu pour un codage agentique robuste. Il prend en charge une capacité contextuelle native de 256 000 tokens, pouvant aller jusqu’à 1 million, ce qui lui permet de traiter d’immenses bases de code en une seule session.

Ses performances s’expliquent à la fois par sa capacité à gérer un grand volume de jetons, une large fenêtre de contexte et de données synthétiques lors du pré-entraînement, mais également par des techniques avancées de post-entraînement, telles que l’apprentissage par renforcement à long terme (agent RL).

Cette avancée permet au modèle de résoudre des problèmes complexes et réels grâce à des interactions multi-étapes avec des outils externes. En conséquence, Qwen3-Coder atteint des performances SOTA parmi les modèles open source sur SWE-Bench Verified (un benchmark évaluant la capacité des modèles d’IA à résoudre de véritables problèmes logiciels), et ce sans nécessiter de scaling en phase de test ou d’inférence.

Le codage agentique par l’IA transforme le développement logiciel en rendant les flux de travail plus autonomes, efficaces et accessibles. Grâce à sa mise à disposition en open source, à ses capacités avancées en codage agentique, ainsi qu’à sa compatibilité avec les outils et interfaces largement utilisés, Qwen3-Coder offre une solution stratégique aux développeurs dans le monde.

Le modèle Qwen3-Coder-480B-A35B-Instruct est désormais disponible sur Hugging Face et GitHub. Les développeurs peuvent également y accéder via Qwen Chat, ou par le biais d’API proposées sur Model Studio, la plateforme de développement en IA générative d’Alibaba.

Les modèles de codage basés sur Qwen ont déjà dépassé les 20 millions de téléchargements dans le monde. Tongyi Lingma, l’assistant de codage d’Alibaba Cloud alimenté par Qwen, sera prochainement mis à jour avec les capacités agentiques avancées de Qwen3-Coder. Depuis son lancement en juin 2024, la fonctionnalité « AI Programmer » de Tongyi Lingma a permis de générer plus de 3 milliards de lignes de code. Celle-ci assiste les développeurs dans la génération de code, l’optimisation, la correction, la recherche d’extraits et la création de tests unitaires par lots.