Qu'est-ce qu'une IA Open Weight

Qu'est-ce qu'une IA Open Weight - 1 avr. 2025 - 3 min de lecture

Un modèle open weight (à poids ouverts) est un type de modèle d'apprentissage automatique, courant dans l'intelligence artificielle, où les poids du modèle — les paramètres numériques qui dictent la manière dont il transforme les données d'entrée en sorties — sont mis à la disposition du public. Ces poids, affinés lors de l'entraînement, définissent les capacités du modèle. Contrairement aux modèles propriétaires, où les poids et souvent l'architecture sont gardés secrets (comme l'a historiquement fait ChatGPT d'OpenAI), les modèles open weight permettent à quiconque de télécharger, d'inspecter et d'adapter les poids. Cette transparence permet aux développeurs, chercheurs ou passionnés de peaufiner le modèle (fine-tuning), de l'intégrer dans des projets ou d'étudier sa mécanique sans avoir à le réentraîner de zéro — un processus extrêmement gourmand en ressources.

Des exemples récents soulignent l'évolution de cette tendance au 31 mars 2025. OpenAI, longtemps partisan des modèles fermés, vient d'annoncer son premier modèle open weight depuis GPT-2, teasé par Sam Altman sur X comme un rival capable de raisonnement face à des modèles comme o3-mini, dont la sortie est prévue dans les mois à venir avec des poids accessibles.

De même, DeepSeek V3, originaire de Chine, domine les benchmarks de non-raisonnement, offrant des poids entièrement téléchargeables aux côtés de son modèle de raisonnement R1, qui rivalise avec le o1 d'OpenAI en mathématiques et en codage. Mistral Large 2, avec son contexte de 128k tokens et ses prouesses en codage, et Gemma 3 de Google, excellant dans les tâches d'entreprise, fournissent également des poids ouverts, tout comme la série Nemotron de NVIDIA (par exemple, Super 49B), ciblant les applications de raisonnement. Ces sorties — provenant souvent d'acteurs majeurs comme OpenAI, Google et NVIDIA — montrent un virage vers l'ouverture, bien que le statut de véritable "open-source" (incluant les données d'entraînement) varie.

Voici quelques exemples de certains des derniers modèles open weight au 31 mars 2025, basés sur les récents développements du paysage de l'IA :

Le futur modèle Open-Weight d'OpenAI

OpenAI, connu pour ses modèles propriétaires comme ChatGPT, a annoncé son intention de publier son premier modèle open weight depuis GPT-2 (sorti en 2019). Ce nouveau modèle, évoqué par le PDG Sam Altman, présentera des capacités de raisonnement similaires au modèle o3-mini et devrait être lancé dans les mois à venir. Bien que des détails comme la taille des paramètres ou la date de sortie exacte restent confidentiels, il est positionné pour concurrencer les autres leaders de l'open weight, offrant aux développeurs la possibilité de personnaliser ses poids pour des tâches spécifiques.

DeepSeek V3

Développé par la startup chinoise DeepSeek, le modèle V3 (sorti sous le nom DeepSeek V3-0324) est une figure de proue de l'espace open weight. Il est remarquable pour être le premier modèle open weight à mener les benchmarks de non-raisonnement, comme souligné dans plusieurs publications sur X. DeepSeek propose également le modèle de raisonnement R1, qui égale ou dépasse le o1 d'OpenAI dans des domaines comme les mathématiques et le codage. Ces modèles sont entièrement accessibles, avec des poids disponibles au téléchargement pour les développeurs, ce qui en fait une option puissue pour une personnalisation rentable.

Mistral Large 2

Publié par Mistral AI, Mistral Large 2 est un modèle open weight conçu pour rivaliser avec les meilleurs modèles comme Llama 3.1 405B de Meta. Avec une fenêtre de contexte de 128k tokens et des capacités multilingues, il excelle dans les tâches de codage dans des langages comme Python et Java. Ses poids sont publiquement disponibles, permettant un ajustement précis pour des applications spécialisées, et il a été salué pour la réduction des hallucinations par rapport à son prédécesseur, Mistral 7B.

Google Gemma 3

La dernière offre open weight de Google, Gemma 3, s'appuie sur le succès de la série Gemma. Il a été remarqué pour ses performances impressionnantes dans les tâches d'entreprise telles que l'extraction de données, obtenant des scores proches du modèle propriétaire Gemini 2.0 Flash de Google lors des évaluations. Les poids sont ouvertement disponibles, ce qui en fait un choix solide pour les développeurs à la recherche d'un modèle puissant et économique pouvant être exécuté localement ou affiné.

Série NVIDIA Nemotron

NVIDIA a récemment introduit sa famille de modèles open weight Nemotron, comprenant Nano (8B), Super (49B) et Ultra (249B). Ce sont des modèles axés sur le raisonnement basés sur l'architecture Llama. Les premiers tests suggèrent que le modèle Super 49B obtient des résultats solides, comme 64 % sur le benchmark GPQA Diamond en mode raisonnement, avec des poids disponibles pour un usage public, ciblant les applications nécessitant un traitement logique robuste.

Tags:

AI- DeepSeek- ChatGPT- LLM- Open Weight Model- AI Model- OpenAI- Tech & AI

Qu'est-ce qu'une IA Open Weight

Qu'est-ce qu'une IA Open Weight - 1 avr. 2025 - 3 min de lecture

Hong Kong s'apprête à autoriser les banques à émettre leur propre crypto — Voici ce que cela signifie

Wall Street place le marché boursier de 126 billions de dollars sur la Blockchain

Au-delà d'OpenClaw : Comment MoltHub construit le registre mondial de l'IA autonome

Qu'est-ce qu'un IRA en bourse

Comment utiliser l'AltRank et le Galaxy Score pour améliorer votre stratégie de trading crypto