mar 3 février 2026
AccueilIntelligence artificielleLe vrai coût de l'IA : attention aux modèles 'bon marché'

Le vrai coût de l’IA : attention aux modèles ‘bon marché’

Date:

Ceci pourrait vous plaire




Arcane Visions - Thème astral

Une étude récente a révélé que les modèles d’intelligence artificielle open-source consomment significativement plus de ressources informatiques que leurs concurrents closed-source lors de l’exécution de tâches identiques, ce qui pourrait compromettre leurs avantages économiques et remodeler la manière dont les entreprises évaluent les stratégies de déploiement de l’IA.

L’étude menée par la société d’IA Nous Research a montré que les modèles open-weight utilisent entre 1,5 et 4 fois plus de tokens – les unités de base de calcul de l’IA – que les modèles fermés comme ceux d’OpenAI et d’Anthropic. Pour les questions de connaissances simples, l’écart s’est considérablement creusé, certains modèles open utilisant jusqu’à 10 fois plus de tokens.

Ces résultats remettent en question l’idée répandue dans l’industrie de l’IA selon laquelle les modèles open-source offrent des avantages économiques clairs par rapport aux alternatives propriétaires. Alors que les modèles open-source coûtent généralement moins cher par token à exécuter, l’étude suggère que cet avantage peut être « facilement compensé s’ils nécessitent plus de tokens pour raisonner sur un problème donné ».

L’inefficacité est particulièrement prononcée pour les Large Reasoning Models (LRMs), qui utilisent des « chaînes de pensée » étendues pour résoudre des problèmes complexes. Ces modèles, conçus pour réfléchir étape par étape, peuvent consommer des milliers de tokens en réfléchissant à des questions simples qui devraient nécessiter une puissance de calcul minimale.

L’étude a révélé des différences marquées entre les fournisseurs de modèles. Les modèles d’OpenAI, en particulier ses variantes o4-mini et gpt-oss récemment publiées en open-source, ont démontré une efficacité exceptionnelle en termes de tokens, notamment pour les problèmes mathématiques. Parmi les options open-source, le modèle llama-3.3-nemotron-super-49b-v1 de Nvidia s’est révélé être « le modèle open weight le plus efficace en tokens dans tous les domaines », tandis que les nouveaux modèles de sociétés comme Magistral ont montré une « utilisation exceptionnellement élevée de tokens » en tant que valeurs aberrantes.

Les implications immédiates des résultats de cette étude pour l’adoption de l’IA en entreprise sont importantes, car les coûts de calcul peuvent augmenter rapidement avec l’utilisation. Les entreprises évaluant des modèles d’IA se concentrent souvent sur les benchmarks de précision et les prix par token, mais peuvent négliger les exigences computationnelles totales pour les tâches réelles.

Les chercheurs suggèrent que l’efficacité en tokens devrait devenir un objectif d’optimisation principal aux côtés de la précision pour le développement futur des modèles. Alors que l’industrie de l’IA se dirige vers des capacités de raisonnement plus puissantes, cette étude suggère que la véritable concurrence ne réside peut-être pas dans la construction du modèle d’IA le plus intelligent, mais dans celui qui peut construire le plus efficace.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici