1.リード文
2026年半ば、世界の株式市場は依然として人工知能(AI)という歴史的な技術革新の熱狂に包まれている。AIテクノロジーの基盤を支える半導体の需要は凄まじく、2025年7月にNVIDIA(以下、NVDA)は世界で初めて時価総額4兆ドルの大台を突破する企業となった。AIチップ市場において推定80%〜85%という圧倒的な市場シェアを握り、同社のデータセンター部門の年間売上高は2026年度に1,937億ドルに到達している。2025年を通じて、AI関連企業は米国株式市場の利益の約80%を占めるに至った。誰もが「AIインフラの勝者はNVDAである」と信じて疑わないかのような状況が続いている。
しかし、市場の深層では静かだが極めて重要な地殻変動が起き始めている。ウォール街のトレーディングデスクから機関投資家の資金フローに至るまで、これまでNVDAに集中していた「スマートマネー(賢明な投資家の資金)」が、少しずつ別の場所へと移動し始めているのだ。機関投資家の大口売買動向を追跡するチャイキン・マネー・フロー(CMF)指標を観察すると、NVDAがマイナス圏(緩やかな売り越し)に転じた一方で、最大のライバルであるAdvanced Micro Devices(AMD)に対しては0.24という明確なプラスの数値(買い越し)を示している。
なぜ、投資家たちは最強の王者の陣地から資金を移し始めているのだろうか。その背景には、AI市場のフェーズがモデルの「学習(トレーニング)」から、実社会でサービスとして稼働する「推論(インファレンス)」へと本格的に移行し始めたことにある。そして、AMDやアルファベット(Google)、さらにはAmazonやMetaといった巨大テクノロジー企業が独自に展開する「カスタムAIチップ」が、かつてないほどの性能とコストパフォーマンスを武器に、NVDAの牙城を物理的かつ経済的に切り崩しにかかっているからである。
本記事では、公開されている最新の市場データ、各社の決算ガイダンス、および技術的な調査レポートを丁寧に紐解きながら、市場シェアの変動、Googleが誇る最新TPUの破壊的な性能、そして巨大顧客たちが水面下で進めるしたたかなインフラ戦略について、現実的かつ論理的に、そして分かりやすく解説していく。
2.要約
AI半導体市場の次なる潮流を読み解く上で、重要となるポイントは以下の3つの要素に集約される。
第一に、巨大テクノロジー企業(ハイパースケーラー)による莫大な設備投資と、利益を享受する企業の二極化である。Microsoft、Amazon、Google、Metaの4社は、2026年に前年比77%増となる合計約7,250億ドルもの設備投資(Capex)を計画している。しかし株式市場では、巨額の資金を投じる側(Funder)よりも、その資金を回収して確実な利益を上げる半導体製造やカスタムチップ関連企業(Collector)へと評価が移りつつある。
第二に、AMDによるハードウェアとソフトウェアの両面からの猛追である。AMDが投入した最新AIチップ「Instinct MI350シリーズ」は、AI処理のボトルネックとなるメモリ容量においてNVDAの次世代機を凌駕している。さらに、「CUDA(クーダ)」と呼ばれるNVDAの強力なソフトウェアの壁が、オープンソースのコンパイラである「Triton」や成熟した自社プラットフォーム「ROCm 7.1」によって突き崩されつつある。これにより、OpenAIやMetaといった巨大顧客が数ギガワット規模のAMD製品導入に踏み切っている。
第三に、アルファベット(Google)の第7世代TPU「Ironwood」をはじめとする、推論特化型カスタムAIチップ(ASIC)がもたらすコスト革命である。汎用性に優れるNVDAのGPUに対し、推論計算に極限まで特化したTPUは、消費電力とコストの面で圧倒的な優位性を持つ。最先端AI企業であるAnthropicは、数十億ドルを投じて100万基ものTPUを利用する長期契約を結んでおり、これが結果としてNVDAの潜在的な市場シェアを奪う構造となっている。
3.解説
3.1 「Funder(出資者)」と「Collector(回収者)」に分断されるAI市場
現在のAIインフラ市場を理解するためには、まず資金の流れを俯瞰する必要がある。クラウド市場を支配する「ビッグ4」——Amazon(AWS)、Microsoft(Azure)、Alphabet(Google Cloud)、Metaは、AIモデルの開発とサービスの提供において覇権を握るため、歴史上類を見ない規模のインフラ投資を行っている。
公開された各社の決算ガイダンスに基づく2026年の設備投資額(Capex)の推移を比較すると、その異常とも言えるスケールが浮き彫りになる。
| 企業名 | 2025年実績(推定) | 2026年ガイダンス | 前年比成長率 | 主なAI投資の対象と独自チップ |
| Amazon | 約1,000億ドル | 約2,000億ドル | 約+100% | AWSデータセンター, Trainium 3, Anthropic提携 |
| Microsoft | 約950億ドル | 約1,900億ドル | 約+100% | Azure, Maia 200, OpenAIへの計算資源提供 |
| Alphabet (Google) | 約850億ドル | 1,750〜1,850億ドル | 約+110% | Google Cloud, TPU v7 Ironwood |
| Meta | 約700億ドル | 1,150〜1,350億ドル | 約+80% | MTIA, 独自のLlamaモデル開発インフラ |
| 合計 | 約4,100億ドル | 約7,250億ドル | +77% | [cite: 4, 5, 6] |
この合計約7,250億ドルという途方もない資金の大部分は、新しいAIデータセンターの建設、土地の取得、電力インフラの確保、そして何よりAIを計算するための半導体ハードウェアの購入に充てられている。しかし、2026年6月の株式市場において、投資家たちは極めて冷静な判断を下した。
自らの身銭を切って巨額の投資を行うこれらのハイパースケーラー(Funder)の株価は、投資に対する明確な利益回収(ROI)がまだ理論上の域を出ないとして、一斉に下落したのである。Microsoftは18%、Metaは8%、Amazonは7%の下落を記録した。その一方で、彼らが支払う7,250億ドルを確実に売上として回収する企業群(Collector)——すなわち、半導体製造装置のASML、メモリ大手のSK Hynix、そして世界最大のファウンドリであるTSMCなどの株価は、軒並み史上最高値を更新するか、二桁の力強い上昇を見せた。
本来であれば、NVDAも最大の「Collector」として恩恵を受けるはずである。しかし、同月にNVDAの株価も一時13%から14%の下落を経験した。これは、AIインフラの中心がNVDAの汎用GPUから、各社が自社開発する「カスタムAIチップ」へとシフトし始めていることを、市場が敏感に察知した結果だと言えるだろう。
3.2 「学習」から「推論」へのシフトと、電力という絶対的な壁
なぜハイパースケーラーたちは、莫大な開発費を投じてまで自社専用のカスタムAIチップ(ASIC)を作りたがるのだろうか。その最大の理由は、AI計算の主戦場が「学習(トレーニング)」から「推論(インファレンス)」へと移行したことにある。
2022年頃までは、AIモデルを賢くするための学習プロセスこそが最大のコストセンターであった。しかし2026年現在、業界のデータによれば、AIインフラにかかる計算費用の実に60%から80%が「推論」向けに費やされている。世界中で毎日何十億回と使われるCopilot、Gemini、ClaudeといったAIサービスに応答し続けるには、学習時とは比較にならないほどの莫大な持続的コストがかかる。ハイパースケーラーにとって、推論処理における計算効率を30%改善できれば、独自チップの開発費など数ヶ月で回収できてしまうのである。
NVDAのGPUは「あらゆる計算を汎用的にこなせる」という点で非常に優れており、例えるなら鍛え上げられた筋肉のような力強さを持っている。しかし、その汎用性の高さゆえに、1基あたり1,000Wから1,200W(次世代のBlackwell B200の場合)という膨大な電力を消費してしまう。現在、巨大なAIデータセンターは単体で500メガワットから1ギガワット(GW)もの電力を必要としており、電力インフラの限界がAI開発の足かせとなりつつある。
こうした状況下で、推論に特化したカスタムAIチップの市場は、2033年までに年平均44.6%という驚異的なペースで成長すると予測されており、GPUベースのソリューションの成長率(16.1%)を大きく凌駕する勢いを見せている。NVDAが握る90%以上の推論市場シェアは、2028年までに20〜30%程度まで低下する可能性があると指摘するアナリストも存在する。
3.3 AMDの猛追:ハードウェアの圧倒的スペックと崩れゆく「CUDAの堀」
NVDAに対する構造的な脅威となっているのは、ハイパースケーラーの独自チップだけではない。汎用AIアクセラレータ市場において長らく2番手に甘んじていたAMDが、リサ・スーCEOの指揮の下、驚異的なペースでNVDAとの技術格差を埋め、一部の領域では凌駕し始めている。
物理的な限界を突破するメモリ容量
AMDが2025年後半に発表した「Instinct MI350シリーズ」は、データセンター向けGPUとして極めて強力なスペックを備えている。以下の表は、AMDの最新GPUとNVDAの次世代機、そしてGoogleの最新TPUの主要な仕様を比較したものである。
| スペック / モデル名 | AMD Instinct MI355X | NVIDIA B200 (Blackwell) | Google TPU v7 (Ironwood) |
| アーキテクチャ | CDNA 4 | Blackwell | 独自設計 (SparseCore搭載) |
| 搭載メモリ容量 | 288 GB (HBM3e) | 192 GB (HBM3e) | 192 GB (HBM3e) |
| メモリ帯域幅 | 8.0 TB/s | 8.0 TB/s | 7.37 TB/s |
| ピーク性能 (FP8) | 約 5,000 TFLOPS | 4,500 TFLOPS | 4,614 TFLOPS |
| 設計電力 (TDP) | 最大 1,400 W | 最大 1,000W〜1,200W | 300W〜 (詳細非公開) |
| データソース | [cite: 3, 8, 23] | [cite: 3, 20, 21] | [cite: 24, 25, 26] |
ここで最も注目すべきは、AMDのMI355Xが搭載する「288GB」という巨大なHBM3eメモリである。NVDAのB200が搭載する192GBと比較して約1.5倍の容量を誇る。AI、特に数千億のパラメータを持つ大規模言語モデル(LLM)の推論において、真のボトルネックは計算速度ではなく「チップの計算コアにデータをいかに速く、大量に供給できるか」というメモリへの依存度にある。
AMDの288GBというメモリ容量は、これまでNVDAのGPUが複数枚必要だった巨大なモデルを、より少ない数のチップ内に収めることを可能にする。これにより、チップ間の通信遅延が減少し、データセンターのラックスペースや導入コストの大幅な節約に直結する。業界標準のベンチマークである「MLPerf 5.1」のトレーニング部門において、MI355XはLlama 2-70Bモデルの学習をわずか10.18分で完了させ、NVDAのB200およびB300ベースのシステムの平均タイム(それぞれ9.85分、9.59分)に肉薄する圧倒的なパフォーマンスを実証した。
ソフトウェアの壁「CUDA」を無力化するTritonの台頭
しかし、どれほどハードウェアが優れていても、NVDAには「CUDA(クーダ)」という難攻不落のソフトウェアエコシステムが存在していた。世界中のエンジニアがCUDAを使ってAIを開発しているため、他社のチップへの移行は困難であると考えられてきた。
ところが2026年現在、この常識は崩れ去りつつある。その最大の功労者が、オープンソースのコンパイラ言語である「OpenAI Triton」である。Tritonは、Pythonで書かれたAIのコードを、実行するハードウェア(NVDAであれAMDであれ)に最適な低レイヤーの機械語へと自動的に変換(JITコンパイル)してくれる「自動翻訳機」のような役割を果たす。これにより、開発者は特定のハードウェアに依存したコードを書く必要がなくなり、実質的にCUDAへのロックイン(囲い込み)が解除されつつあるのだ。
さらに、AMD自身も自社のソフトウェア基盤である「ROCm(ロックエム)」をバージョン7.1へと進化させ、NVDAのCUDAとほぼ同等のメモリ管理機能やマルチGPU通信ライブラリ(RCCL)を提供し始めた。開発者はPyTorchなどの主要フレームワーク上で、既存のコードを書き換えることなくAMDプラットフォームをネイティブに動作させることが可能になった。ソフトウェアの壁が消滅したことで、顧客は純粋に「ハードウェアの性能とTCO(総所有コスト)」だけでベンダーを選択できるようになったのである。
巨大顧客の戦略的離反とAMDへの投資
このソフトウェアの進化を背景に、巨大IT企業たちはNVDAへの過度な依存から脱却する動きを加速させている。
2025年10月、AIの最先端を走るOpenAIは、AMDの株式を最大10%取得し、最大6ギガワット(GW)相当のGPU供給を確保するという異例の戦略的提携を結んだ。Metaもまた、次世代のMI450アーキテクチャを含む複数世代のAMD Instinct GPUを最大6GW導入する複数年契約を発表し、自社のAIインフラにおけるAMDの割合を劇的に高めている。Oracleのクラウド部門(OCI)に至っては、131,072基ものMI355Xをネットワークで結合した、途方もない規模のゼタスケールAIスーパーコンピューターの提供を開始した。
巨大顧客たちの狙いは明白である。単一ベンダーに価格決定権を握られるリスクを排除し、NVDAとAMDを競わせることでインフラコストを適正化することだ。AMDのデータセンター部門の売上は、2025年度時点で約166億ドルに達し、そのうちAI向けInstinct GPUの売上は70〜80億ドル規模にまで急成長を遂げている。絶対的な売上額では依然としてNVDAが勝るものの、AMDは確実に「信頼できる第2の選択肢」としての地位を確立したと言える。
3.4 アルファベット(Google)の切り札:第7世代TPU「Ironwood」がもたらす破壊的効率
AMDが汎用GPU市場でNVDAに挑む一方で、別の角度からAIインフラの根本を書き換えようとしているのが、アルファベット(Google)のカスタムAIチップである「Tensor Processing Unit(TPU)」である。
2015年から10年以上にわたってTPUを進化させてきたGoogleは、2025年に第7世代となる「TPU v7 Ironwood」を発表し、2026年に本格稼働を開始した。Ironwoodは、これまでのモデルとは異なり、明確に「推論の時代(Age of Inference)」を見据え、大規模言語モデル(LLM)やMixture of Experts(MoE)などの「考えるモデル」の処理に極限まで特化して設計されている。
行列演算に特化した「静脈」のアプローチ
NVDAのGPUが、多様な計算を高速にこなす「筋肉」のようなアプローチだとすれば、GoogleのTPUはデータが効率的に流れる「静脈」のようなアプローチ(シストリックアレイ構造)を採用している。一般的なプロセッサが計算のたびにメモリへデータを読み書きするのに対し、TPUは演算器のネットワークの中をデータが血流のように一度流れるだけで、数千回の計算が連鎖的に完了する仕組みになっている。この構造的違いにより、TPUは余分な電力消費を極限まで抑えることができる。
Ironwoodの単体性能は、4,614 TFLOPS(4.6 PFLOPS)のFP8演算能力と、前世代(Trillium)の6倍となる192GBのHBM3eメモリを備え、NVDAのB200に匹敵するハードウェアスペックを持つ。しかし、TPUの真の恐ろしさは単体の性能ではなく、その「スケール能力」にある。
Googleのデータセンター内では、最大9,216基のIronwoodチップが独自の光通信ネットワーク(ICI)によってシームレスに結合され、1つの巨大な頭脳(スーパーポッド)として機能する。これにより、スーパーポッド全体の演算能力は42.5 Exaflops(エクサフロップス)という、世界最大のスーパーコンピューターすら遥かに凌ぐ領域へと到達する。この規模での通信ボトルネックを解消している点こそが、Googleの最大の強みである。
この推論効率の高さは、実際のビジネスに劇的なコスト削減をもたらしている。例えば、画像生成AIを手掛けるMidjourneyは、NVDAのGPUクラスターからGoogleのTPUインフラ(v6e)へ移行したことで、月間の推論コストを210万ドルから70万ドルへ、実に3分の1にまで圧縮することに成功した。
Anthropicの巨額投資:100万基のTPUが稼働する日
TPUの実力とスケールを世界に知らしめた最も象徴的な出来事が、最先端のAIモデル「Claude」を開発するAnthropicの戦略的動きである。
Anthropicは2025年10月、Google Cloudに対して「最大100万基のTPU」を利用し、2026年中に1ギガワットを優に超える計算能力を稼働させるという、数十億ドル規模の巨大契約を発表した。さらに2026年4月には、Googleおよびチップ設計大手のBroadcomと提携し、2027年以降に稼働する「複数ギガワット規模の次世代TPU」の確保にも動いている。
現在、AnthropicのClaudeは世界中の30万以上の企業顧客に利用され、100万ドル以上を消費する大口顧客がわずか数ヶ月で倍増するなど、その年間収益のランレートは300億ドルを突破する勢いで成長している。これほどの爆発的な推論需要を支えるためには、もはや高価で電力消費の激しいGPUを買い続けることは経済的に成り立たない。AnthropicはAWSの「Trainium」、Googleの「TPU」、そしてNVDAの「GPU」をワークロードごとに使い分けるマルチプラットフォーム戦略をとっているが、その推論インフラの中核としてTPUを深く信頼していることが伺える。
ここで投資家として極めて重要な視点がある。Anthropicのような超巨大顧客が、数十億ドルを投じて100万基のTPUを利用するということは、「本来であればNVDAのGPUが買われていたはずの市場シェア」が、そのまま物理的に消滅したという事実を意味している。AIの運用が内製化されたクラウドインフラで行われるほど、NVDAが販売できる余地は狭まっていくのである。
3.5 カスタムASIC市場を裏で操る「Collector」たち
GoogleのTPUに留まらず、Amazon(AWS)は第3世代となる「Trainium 3(3nmプロセス、144GB HBM3E搭載)」を展開し、自社クラウド内でのコスト競争力を高めている。また、Metaも独自の推論チップ「MTIA」のロードマップを積極的におし進めている。
こうしたハイパースケーラーのカスタムAIチップ開発競争において、表舞台には立たないが莫大な利益を上げているのが、Broadcom(ブロードコム)である。BroadcomはGoogleのTPUやMetaのMTIAなど、顧客が設計したAIアクセラレータの論理設計から製造までのプロセスを支援し、さらにAIクラスターを繋ぐためのネットワーキングチップを独占的に供給している。同社のAI向けASIC関連の売上は、2025年度時点で200億ドルを突破しており、文字通り「AIのツルハシとシャベル(基盤)」を提供する最強のCollectorの一角となっている。
4.結論
「NVDAの独走を止めるのは誰だ?」という問いに対する答えは、決して単一の企業ではない。
それは、288GBという大容量メモリを搭載したハードウェアと、Tritonによるオープンソフトウェアの波に乗って真っ向から勝負を挑み、OpenAIやMetaから数ギガワットの契約を勝ち取ったAMDである。 同時に、行列演算に極限まで特化し、推論コストの限界を打ち破る巨大なスーパーポッドを構築してAnthropicを取り込んだアルファベット(Google)である。 そして何より、7,250億ドルもの設備投資を行いながらも、その運用コスト(推論コスト)と電力の壁を最適化しようと必死にカスタムシリコンへの移行を進めるハイパースケーラーたちの経済的な合理性そのものである。
2026年という年は、AI半導体市場が「NVDAによる完全な独占」から、明確な役割分担を伴う「巨大資本による寡占(マルチベンダー化)」へと構造的な転換を果たした年として記憶されるだろう。新しいAIモデルをゼロから生み出す最先端のトレーニング環境や、汎用性が求められるエンタープライズ市場においては、NVDAのGPUが引き続き絶対的な王者として君臨し続けることに疑いの余地はない。しかし、世界中の人々が日常的にAIを利用する「推論の海」においては、AMDのMI350シリーズやGoogleのIronwoodといった製品が、着実にその領土を切り取り始めている。
AIインフラの多様化に伴い、資金の流れはNVDA一極集中から、TSMCのようなファウンドリ、大容量メモリを供給するSK Hynix、そしてBroadcomのようなASIC・ネットワーク関連企業など、エコシステム全体へと拡散していくフェーズに入った。テクノロジーが社会の真のインフラストラクチャーとして根付いていく中で、半導体市場の熾烈で静かな競争は、今後も我々にさらなる革新をもたらしてくれるはずである。各社の次なる一手から、ますます目が離せない。
注意:本記事は、公開されている市場データおよび調査レポートに基づき、投資判断の参考として作成されたものです。実際の投資にあたっては、各国の法規制、市場動向、および企業の財務状況を十分に精査した上で、自己責任で行ってください。

