La récente percée de la startup chinoise DeepSeek a secoué le marché et provoqué des ondes de choc à travers la Silicon Valley, remettant en question certaines des hypothèses fondamentales sur lesquelles les entreprises d’intelligence artificielle opéraient et se développaient.
En moins de deux ans, ce nouvel arrivant basé à Beijing a réalisé ce que beaucoup pensaient impossible : créer des modèles d’IA qui rivalisent avec les géants de l’industrie tout en ne dépensant qu’une fraction de leur budget pour l’enseignement des modèles et l’inférence des réponses.
L’impact de leur lancement public a été immédiat et mesurable. Selon le South China Morning Post, des actions technologiques majeures, dont Nvidia, Microsoft et Meta, ont connu des baisses significatives alors que les investisseurs tentaient de comprendre les implications de l’existence de DeepSeek.
L’application d’assistant AI gratuite de la startup pour iOS et Android, lancée le 10 janvier, a rapidement grimpé en tête du classement de l’App Store américain d’Apple, détrônant ChatGPT d’OpenAI et marquant ainsi une première historique pour un produit d’IA chinois sur le marché américain.
Ce qui rend cela particulièrement significatif, c’est l’approche technologique de DeepSeek. The Algorithmic Bridge rapporte que la société a mis en œuvre plusieurs solutions innovantes, notamment le Multi-head Latent Attention (MLA) pour réduire les goulots d’étranglement de la mémoire et le Group Relative Policy Optimisation (GRPO) pour rationaliser l’apprentissage par renforcement.
Ces avancées permettent à DeepSeek d’obtenir des résultats comparables, voire supérieurs, à ceux de ses concurrents américains tout en utilisant beaucoup moins de ressources. L’efficacité des ressources de l’entreprise est frappante : DeepSeek fonctionne avec moins de 100 000 GPU H100, tandis que Meta déploiera 1,3 million de GPU d’ici fin 2025.
Cette efficacité s’étend au-delà du matériel. The Algorithmic Bridge suggère que l’approche de DeepSeek représente une amélioration de dix fois de l’utilisation des ressources lorsqu’on prend en compte des facteurs comme le temps de développement et les coûts d’infrastructure.
Cependant, la montée rapide dans la conscience des utilisateurs occidentaux n’a pas été sans défis. Le South China Morning Post a signalé que la popularité soudaine de DeepSeek a entraîné un stress significatif sur l’infrastructure, provoquant des pannes de serveurs et des préoccupations en matière de cybersécurité qui ont conduit à des limites temporaires d’inscription. Ces difficultés soulignent les défis du monde réel pour le passage à l’échelle des services d’IA, indépendamment de l’efficacité architecturale.
L’engagement de l’entreprise envers le développement open-source et la transparence de la recherche contraste nettement avec les approches secrètes des grandes entreprises technologiques américaines. Pour de nombreux observateurs de l’industrie, une IA ouverte et hébergée localement pourrait être le modèle de déploiement privilégié.
L’entreprise a été saluée par des personnalités éminentes de l’industrie technologique, dont le capital-risqueur Marc Andreessen, qui a décrit les développements de DeepSeek comme « l’une des percées les plus étonnantes et impressionnantes ».
Les implications politiques des événements sont significatives. Le président américain Donald Trump a qualifié l’émergence de DeepSeek de « réveil » pour l’industrie américaine, reflétant des préoccupations plus larges sur la concurrence technologique entre les États-Unis et la Chine. Il continue à lutter contre la concurrence chinoise dans la technologie, imposant des tarifs restrictifs qui ont affecté tous les coins du globe.
Cependant, la situation dépasse la simple rivalité nationale, représentant un défi fondamental pour la pensée établie sur le développement de l’IA.
À l’avenir, plusieurs questions clés demeurent. L’approche efficace de DeepSeek peut-elle s’adapter à la demande croissante? Les acteurs établis ont-ils adapté leurs stratégies de manière efficace? L’entreprise chinoise a démontré que l’efficacité algorithmique et la collaboration ouverte peuvent remplacer la puissance de calcul brute et le secret en tant que moteurs principaux de l’avancement de l’IA.
La perturbation du marché de l’IA pourrait finalement bénéficier à l’ensemble du secteur en obligeant une réévaluation des pratiques établies et pourrait potentiellement conduire à des méthodes de développement de l’IA plus efficaces et accessibles.
Bien que les réalisations de DeepSeek soient remarquables depuis leur arrivée dans la conscience du public, il est important de noter que les grandes entreprises technologiques américaines ont également publié leurs propres avancées, et la volatilité du marché technologique reste élevée.
Ce qui est clair, c’est que DeepSeek a introduit une alternative viable à l’approche intensive en capital qui a dominé le développement de l’IA. Que cela devienne la nouvelle norme de l’industrie ou simplement l’une des nombreuses stratégies réussies reste à voir, mais l’impact de l’entreprise sur le secteur est déjà significatif.


