Commmonn Ground

Tech & AI

NVIDIA GTC 2026:AI業界は「学習」から「実行」へとシフトした

ジェンスン・フアンがサンノゼのSAPセンターのステージに降り立ち、NVIDIA史上最も重要となるであろう基調講演を行いました。それは単一のチップの発表によるものではありません。GTC 2026は、AI業界がモデルの「構築」から「デプロイ(展開)」へと正式に軸足を移した瞬間として記憶されるでしょう。

190カ国から3万人がサンノゼのダウンタウンに集結しました。基調講演は、新しいシリコン、新しいソフトウェア、新しい物理学、そして新しい経済学を網羅したフルスタックの宣言でした。ここでは、何が本当に重要で、なぜそれが重要なのかを紐解きます。

Vera Rubin:推論コスト10倍削減がすべてを変える

GTC 2026の目玉は、2024年から2025年を席巻したBlackwellアーキテクチャの後継となる「Vera Rubin」です。暗黒物質(ダークマター)の存在を証明した天文学者にちなんで名付けられたこのプラットフォームは、Rubin GPU、Vera CPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet Switchの6つのチップで構成されています。

主要なスペックは驚異的です:

  • Blackwellと比較して推論トークンコストを10分の1に削減
  • Mixture-of-Experts(混合専門家)モデルの学習に必要なGPU数を4分の1に削減
  • 推論用にGPUあたり50ペタフロップスのNVFP4演算性能
  • ユニットあたり3.0 TB/s以上の帯域幅を持つ288GB HBM4メモリ
  • 260 TB/sのラック帯域幅(インターネット全体のトラフィックを上回る)

「推論コストの10倍削減」という数字こそが、ビジネスプランを書き換える決定打となります。これまで運用コストが高すぎて実現困難だったアプリケーション(常時稼働のAIエージェント、リアルタイムビデオ処理、継続的なコードレビューなど)が、一夜にして経済的に実行可能になります。これは漸進的な改善ではなく、今後18ヶ月かけてクラウドプロバイダーの価格体系に波及していく段階的な飛躍です。

Vera Rubinはすでにフル生産体制に入っています。AWS、Google Cloud、Microsoft Azure、Oracleは、2026年後半にRubinベースのインスタンスを導入予定です。Microsoftの次世代「Fairwater AIスーパーファクトリー」は、数十万個のVera Rubinスーパーチップ規模に拡張されます。AI界のビッグネームであるOpenAI、Anthropic、Meta、xAIもすべて導入を確約しています。

NemoClaw:NVIDIAがエージェント・ソフトウェア層に参入

ハードウェアはあくまで前菜に過ぎませんでした。戦略的により重要な発表は、エンタープライズAIエージェントを構築・デプロイするためのオープンソースプラットフォーム「NemoClaw」です。

これは、CUDAを20年にわたる参入障壁(モート)にしたのと同じ戦略です。開発者に無料で深く統合されたツールを提供し、それを「最も抵抗の少ない道」にすることで、ワークロードがNVIDIAハードウェア上でスケールした際に収益を回収するという手法です。NemoClawにより、企業はクラウドに依存することなく、ローカルでファイル、アプリ、ワークフローと対話する自律型エージェントを構築できます。

GTCの参加者は、会場内の「Build-a-Claw」ステーションで、自分専用の常時稼働AIアシスタントを構築することができました。名前を付け、性格を定義し、ツールへのアクセス権を与え、その場でDGX SparkやGeForce RTXノートPCにデプロイできます。これは巧妙な戦略です。何千人もの開発者が、NVIDIAハードウェア上で動作するエージェントを手にして帰路につくのです。

NemoClawと並行して、NVIDIAは「Nemotron 3 Super」をリリースしました。これは1200億パラメータを持ちながら、アクティブなパラメータは120億のみという、エージェンティック・ワークロード専用に設計されたオープンモデルです。100万トークンのコンテキストウィンドウを備えており、エージェントがコードベース全体や数週間の会話履歴をメモリに保持し、文脈を見失うことなく動作することを可能にします。

このモデルはすでにPerplexity、Google Cloud、Oracle、AWS、CoreWeave、および数十の推論プロバイダーに導入されています。Palantir、Siemens、Cadenceなどの企業は、エンタープライズ自動化のためにこのモデルをカスタマイズしています。

フィジカルAI:チャットボットからロボットへ

GTC 2026は、「フィジカルAI(物理的AI)」がNVIDIAの次の1兆ドル規模のテーゼであることを決定づけました。カンファレンスでは、Tesla、Disney、Agility Robotics、KUKA、Universal Robots、Waabiによるロボティクスセッションが行われました。Disneyは、NVIDIAのOmniverseシミュレーションで訓練された強化学習を用いて自律的にバランスをとる、AI搭載のヒューマノイドロボットを披露しました。

「3つのコンピュータ」アーキテクチャがそのストーリーを物語っています。1つは脳を訓練するコンピュータ(DGX)、1つは世界をシミュレートするコンピュータ(Omniverse)、そして1つはロボット上で動作するコンピュータ(Jetson/IGX)です。専門特化したロボットが、掴む、バランスをとる、移動するといった「原子レベルのスキル」を学び、時間をかけてそれらを複合的な能力へと組み合わせていきます。これは、子供がまず専門的なスキルを学び、後に汎用的な能力を身につける過程を模倣しています。

Thinking Machines Labは、ギガワット規模のVera Rubinシステムの導入を発表しました。これは単なる研究室レベルの話ではなく、フィジカルAIインフラへの産業規模のコミットメントです。

Groqの要素とFeynmanの示唆

GTCからの注目すべきシグナルがさらに2つあります。

1つ目は、Groqとの統合です。NVIDIAは昨年、Groqのデータフローアーキテクチャを約200億ドルでライセンス供与したと報じられています。Groqのテクノロジーは、毎秒数千トークンという極めて高速なトークン生成を可能にし、リアルタイムAIエージェントに最適です。GTCではGroqの技術を取り入れた推論製品が示唆されましたが、具体的な詳細はまだ伏せられています。ここから読み取れるのは、NVIDIAがすべてのワークロードを純粋なGPUの問題として扱うのではなく、層状の推論スタックを構築しているということです。

2つ目は、ジェンスンが「世界がまだ見たことのないチップ」を予告したことです。最も有力な候補は、Rubinの次の世代となるアーキテクチャ「Feynman(ファインマン)」です。これはTSMCの1.6nmプロセスを採用し、シリコンフォトニクスを搭載する可能性があります。将来のイベントで確認されれば、NVIDIAのロードマップは3世代先まで見通せることになり、ハイパースケーラーによるカスタムシリコンを今後数年にわたって引き離し続けるという前例のないシグナルとなります。

これが実際に意味すること

GTC 2026は、カンファレンスを装った単なるGPUの発表会ではありません。AI業界が「学習」から「実行」へとシフトしたという宣言です。

推論の時代が到来しました。モデルの実行コストは下がり続けています。エージェントは自律的に動作するためのフレームワークを手に入れました。ロボットは学習するための物理エンジンを手に入れました。そしてNVIDIAは、原子レベルからアプリケーションまで、そのすべてを支えるフルスタックプロバイダーとしての地位を固めています。

開発者にとって:推論の経済性は、2027年半ばまでにAPI価格の低下として現れるでしょう。オンデマンドだけでなく、AIを継続的に稼働させるアプリケーションを計画してください。

投資家にとって:新しい指標は「ドルあたりのFLOPS」ではなく、「メガワットあたりのトークン数」です。推論スタックを支配する企業が価値を蓄積していくでしょう。

すべての人にとって:日常的に接するAIは、今後大幅に高速化し、安価になり、より有能になります。今日発表されたインフラが、2027年に皆さんが手にする製品の原動力となるのです。

よくある質問

NVIDIA Vera Rubinとは何ですか?

Vera Rubinは、Blackwellの後継となるNVIDIAの次世代AI演算プラットフォームです。Rubin GPUやVera CPUを含む6つの新しいチップを特徴とし、推論トークンコストを最大10倍削減し、学習に必要なGPU数を4分の1に抑えます。Rubinベースの製品は2026年後半に主要なクラウドプロバイダーから提供されます。

NemoClawとは何ですか?

NemoClawは、エンタープライズAIエージェントを構築するためのNVIDIAのオープンソースプラットフォームです。AIエージェントとは、人間が常に監視しなくても多段階のタスクを実行する自律型システムのことです。NVIDIAハードウェアをエージェンティックAIワークロードのデフォルトのデプロイ先とすることで、CUDAエコシステムをさらに深めるように設計されています。

NVIDIA GTC 2026の基調講演はいつ行われましたか?

ジェンスン・フアンの基調講演は、2026年3月16日(月)午前11時(太平洋標準時)、サンノゼのSAPセンターで行われました。フルリプレイはnvidia.comおよびYouTubeで無料で視聴可能です。