Commmonn Ground

Crypto & Bitcoin

Open Weight AI(オープンウェイトAI)とは何か

Open Weight AI(オープンウェイトAI)とは何か - 2025年4月1日 - 読了時間 3分

オープンウェイトモデル(Open Weight Model)とは、機械学習モデル(主に人工知能)の一種で、入力データをどのように出力に変換するかを決定する数値パラメータである「ウェイト(重み)」が一般に公開されているものを指します。トレーニング中に磨き上げられたこれらのウェイトが、モデルの能力を定義します。ウェイトやアーキテクチャが秘密にされているプロプライエタリ(独占的)なモデル(例:これまでのOpenAIのChatGPTなど)とは異なり、オープンウェイトモデルでは、誰でもウェイトをダウンロードし、検査し、適応させることができます。この透明性により、開発者、研究者、愛好家は、膨大なリソースを必要とするゼロからの再学習を行うことなく、モデルをファインチューニング(微調整)したり、プロジェクトに統合したり、その仕組みを研究したりすることが可能になります。

2025年3月31日時点の最近の事例は、このトレンドの進化を浮き彫りにしています。長年クローズドモデルを提唱してきたOpenAIは、GPT-2以来となる初のオープンウェイトモデルを発表しました。Sam Altman氏がXで予告したところによると、これはo3-miniのようなモデルに匹敵する推論能力を備えたモデルで、今後数ヶ月以内にウェイトが公開される予定です。

同様に、中国のDeepSeek V3は、非推論ベンチマークでトップを走っており、数学やコーディングでOpenAIのo1と競合するR1推論モデルとともに、完全にダウンロード可能なウェイトを提供しています。128kトークンのコンテキストと高いコーディング能力を持つMistral Large 2や、エンタープライズ業務に優れたGoogleのGemma 3、さらに推論アプリケーションをターゲットにしたNVIDIAのNemotronシリーズ(例:Super 49B)もオープンウェイトを提供しています。OpenAI、Google、NVIDIAといった主要プレイヤーからのこれらのリリースは、オープン化へのシフトを示していますが、トレーニングデータまで含む完全な「オープンソース」の定義に当てはまるかどうかは、モデルによって異なります。

2025年3月31日現在のAI業界の動向に基づいた、最新のオープンウェイトモデルの例をいくつか紹介します。

  • OpenAIの次期オープンウェイトモデル

ChatGPTのようなプロプライエタリなモデルで知られるOpenAIは、2019年にリリースされたGPT-2以来となるオープンウェイトモデルのリリース計画を発表しました。CEOのSam Altman氏が予告したこの新モデルは、o3-miniモデルに近い推論機能を備え、今後数ヶ月以内にローンチされる予定です。パラメータ数や正確なリリース日などの詳細は未公開ですが、他のオープンウェイトのリーダーたちと競合し、開発者が特定のタスクに合わせてウェイトをカスタマイズできる環境を提供することを目指しています。

  • DeepSeek V3

中国のAIスタートアップDeepSeekが開発したV3モデル(DeepSeek V3-0324としてリリース)は、オープンウェイト界で際立った存在です。Xでの投稿でも強調されているように、非推論ベンチマークで首位を獲得した初のオープンウェイトモデルとして注目されています。また、DeepSeekは数学やコーディングの分野でOpenAIのo1に匹敵、あるいは凌駕するR1推論モデルも提供しています。これらのモデルは完全にアクセス可能で、開発者がダウンロードして適応できるウェイトが公開されており、コスト効率の高いカスタマイズのための強力な選択肢となっています。

  • Mistral Large 2

Mistral AIがリリースしたMistral Large 2は、MetaのLlama 3.1 405Bのようなトップクラスのモデルに対抗するために設計されたオープンウェイトモデルです。128kトークンのコンテキストウィンドウと多言語対応能力を持ち、PythonやJavaなどのプログラミング言語におけるコーディングタスクで威力を発揮します。ウェイトが公開されているため、専門的なアプリケーションへのファインチューニングが可能で、前身のMistral 7Bと比較してハルシネーション(幻覚)が減少している点も評価されています。

  • Google Gemma 3

Googleの最新のオープンウェイト製品であるGemma 3は、Gemmaシリーズの成功を継承しています。データ抽出などのエンタープライズタスクにおいて、評価テストでGoogle独自のGemini 2.0 Flashに近いスコアを出すなど、印象的なパフォーマンスが報告されています。ウェイトが公開されているため、ローカルで実行したりファインチューニングしたりしたい開発者にとって、コスト効率が高く強力なモデルの選択肢となります。

  • NVIDIA Nemotron シリーズ

NVIDIAは最近、Llamaアーキテクチャに基づいた推論特化型のオープンウェイトモデル群「Nemotronファミリー」を発表しました。これにはNano (8B)、Super (49B)、Ultra (249B)が含まれます。初期のテストでは、Super 49Bモデルが推論モードにおいてGPQA Diamondベンチマークで64%という強力な結果を達成しており、堅牢な論理処理を必要とするアプリケーション向けにウェイトが公開されています。

Tags: