
Le 30 janvier 2025, Alibaba a dévoilé Qwen 2.5-Max, la dernière version de son modèle d’intelligence artificielle, affirmant qu’il surpasse les références actuelles telles que GPT-4o, DeepSeek-V3 et Llama-3.1-405B.
Une architecture innovante pour des performances accrues
Qwen 2.5-Max repose sur une architecture Mixture-of-Experts (MoE), une approche qui améliore la puissance et l’efficacité des modèles en activant seulement une partie de leurs paramètres à chaque requête. Entraîné sur plus de 20 000 milliards de tokens, ce modèle a bénéficié d’un affinement supervisé et d’un apprentissage par renforcement basé sur le feedback humain.
Des résultats impressionnants aux benchmarks
Lors des évaluations, Qwen 2.5-Max a surpassé ses concurrents sur plusieurs benchmarks clés :
• MMLU-Pro : évaluant les connaissances à travers des problèmes de niveau universitaire.
• LiveCodeBench : testant les capacités de codage.
• LiveBench : mesurant les performances générales.
• Arena-Hard : approximant les préférences humaines.
Cependant, le modèle reste en retrait pour la génération d’images.

Accessibilité et ouverture
Alibaba a rendu Qwen 2.5-Max accessible via une API sur Alibaba Cloud et invite les utilisateurs à l’expérimenter sur Qwen Chat. Cette démarche vise à encourager la communauté à explorer et à tirer parti des capacités de ce nouveau modèle.
Contexte concurrentiel

Ce lancement intervient dans un contexte où des acteurs comme DeepSeek et OpenAI dominent le marché de l’IA. DeepSeek, par exemple, a récemment introduit DeepSeek-R1, un modèle open source rivalisant avec les offres d’OpenAI.
Avec Qwen 2.5-Max, Alibaba démontre sa volonté de s’imposer comme un leader dans le domaine de l’intelligence artificielle, en proposant des solutions innovantes et performantes pour répondre aux besoins croissants du marché.