DeepSeek, une startup chinoise spécialisée dans l’intelligence artificielle, a récemment lancé deux nouveaux modèles AI puissants, DeepSeek-V3.2 et DeepSeek-V3.2-Speciale, qui selon la société, égalent voire surpassent les capacités des modèles GPT-5 d’OpenAI et Gemini-3.0-Pro de Google. Ces nouvelles versions ont des implications importantes pour le leadership technologique américain, montrant que DeepSeek peut produire des systèmes AI de pointe malgré les contrôles à l’exportation américains limitant l’accès de la Chine aux puces Nvidia avancées.
Au cœur de cette innovation se trouve DeepSeek Sparse Attention (DSA), une nouvelle technologie architecturale qui réduit considérablement la charge de calcul nécessaire pour exécuter des modèles AI sur de longs documents et des tâches complexes. Contrairement aux mécanismes d’attention traditionnels, DSA identifie uniquement les parties les plus pertinentes du contexte pour chaque requête, réduisant ainsi les coûts d’inférence de moitié par rapport aux modèles précédents.
Les modèles DeepSeek-V3.2 et V3.2-Speciale ont été évalués dans divers domaines, montrant des performances équivalentes voire supérieures à celles des modèles américains tels que GPT-5. Par exemple, DeepSeek-V3.2-Speciale a obtenu des résultats remarquables dans des compétitions de mathématiques et d’informatique prestigieuses, avec des performances dignes d’une médaille d’or.
En introduisant la capacité de « penser en utilisant des outils », DeepSeek-V3.2 révolutionne la manière dont les modèles AI peuvent résoudre des problèmes en utilisant simultanément des outils externes tels que le code, la recherche sur le web et la manipulation de fichiers. Cette capacité permet une résolution fluide de problèmes complexes en plusieurs étapes, sans perdre la trace du raisonnement à chaque appel d’outil externe.
De plus, DeepSeek a adopté une approche open-source en rendant ses modèles disponibles sous licence MIT, permettant à quiconque de télécharger, modifier et déployer ces modèles sans restriction. Cette démarche pourrait bouleverser le modèle économique de l’industrie de l’IA en offrant des performances de pointe à un coût beaucoup plus bas, avec une flexibilité de déploiement accrue.
Cependant, malgré ces avancées technologiques, DeepSeek est confronté à des obstacles réglementaires croissants en Europe et en Amérique, en raison de préoccupations liées à la sécurité des données et aux contrôles à l’exportation. Ces défis pourraient limiter l’adoption de ses technologies dans des applications sensibles, en particulier en raison de ses origines chinoises.
En fin de compte, la sortie de DeepSeek marque un tournant dans la compétition mondiale en matière d’IA, mettant en lumière la capacité des modèles open-source à rivaliser avec les modèles propriétaires, et soulignant l’importance croissante de l’efficacité et de l’accessibilité dans le développement de l’IA de pointe.


