ハードウェア比較(拡張版)

最終更新: 2026-03-03 対象予算: 30〜100万円(参考として100万円超の機種も掲載) 目的: PLAN_01「採用機種の選定経緯」の補足。Mac Studio M3 Ultra・Mac Pro・NVIDIA GPUを含めた詳細比較。


1. ハードウェア詳細比較表

LLM推論速度の最大のボトルネックは メモリ帯域幅。帯域が広いほどトークン生成が速い。

予算内機種(30〜100万円)

#機種チップVRAM/メモリ帯域概算価格OS推奨LLMtok/s(概算)採用
1Mac miniM4 Pro 12C/16G24GB273 GB/s~¥219,000macOSgemma3:12b~25— VRAM不足
2Mac miniM4 Pro 14C/20G48GB273 GB/s~¥339,000macOSqwen2.5:32b~15— 帯域がボトルネック
3RTX 4090 BTO PCCore i9 + RTX 409024GB VRAM1,008 GB/s~¥500,000Win/Linuxgemma3:27b~80-100— 70B CPUオフロード必須
4Mac Studio M4 MaxM4 Max 14C/32G36GB410 GB/s~¥329,000macOSgemma3:27b~20-28— メモリ余裕が少ない
5Mac Studio M4 MaxM4 Max 16C/40G48GB546 GB/s~¥445,000macOSgemma3:27b~30-40✅ 採用
6Mac Studio M4 MaxM4 Max 16C/40G96GB546 GB/s~¥800,000macOSllama3.3:70b~15-20— 70B可だがコスパ悪
7Mac Studio M3 UltraM3 Ultra 28C/60G96GB819 GB/s~¥669,000macOSllama3.3:70b~25-35🔁 70B最高コスパ候補
8Mac Studio M3 UltraM3 Ultra 32C/80G96GB819 GB/s~¥894,000macOSllama3.3:70b~30-38— #7と性能差小
9RTX 5090 BTO PCCore Ultra + RTX 509032GB VRAM1,792 GB/s~¥1,000,000Win/Linuxgemma3:27b~80-100— 70B VRAM不足

⚠️ 価格・tok/s はいずれも概算・推定値(2026-03-03時点)。 特に BTO PC 価格は在庫状況で変動。

参考(予算外: 100万円超)

機種メモリ帯域概算価格備考
Mac Studio M3 Ultra 192GB192GB819 GB/s~¥110〜150万(推定)70B + 大コンテキストが安心
2× RTX 4090 PC48GB VRAM合計1,008 GB/s × 2~¥100〜150万PCIeボトルネックあり・NVLink非対応
RTX 6000 Ada workstation48GB VRAM960 GB/s~¥80〜100万ECC対応・プロ向け・推論速度はRTX 4090より遅い
Mac Pro M4 Ultra未定~1,092 GB/s(推定)未定M4 UltraはUltraFusion未実装のため2026年3月時点では未発売

2. LLMモデル別必要スペック

どのモデルを動かしたいかで必要な機種が決まる。

モデルパラメータQ4_K_M サイズ最小メモリ推奨機種備考
gemma3:12b12B~8GB16GBMac mini 24GB〜、RTX 4080 12GB〜本プロジェクト実績: MacBook Air M2 16GBで動作確認済み
gemma3:27b27B~17GB24GBMac Studio M4 Max 36GB〜、RTX 4090 24GB24GBはKVキャッシュで逼迫。36GB以上推奨
qwen2.5:32b32B~19GB24GBMac Studio M4 Max 36GB〜、RTX 4090 24GB24GBでは実質コンテキスト制限が必要
llama3.3:70b70B~43GB48GBM4 Max 96GB・M3 Ultra 96GB・2×RTX 4090単体RTX 5090(32GB)・RTX 4090(24GB)ではCPUオフロード必須で大幅速度低下
qwen2.5:72b72B~43GB48GB同上同上

48GB が 70B モデルの実質的な最小閾値。 70B を快適に動かすには予算 ¥67万〜(Mac Studio M3 Ultra 96GB)が必要。


3. Apple Silicon vs NVIDIA 実用比較

観点Apple SiliconNVIDIA GPU(RTX 4090/5090)
27B モデル(tok/s)~30-40(M4 Max)~80-100(2〜3倍速い)
70B モデル(tok/s)~25-35(M3 Ultra 96GB)CPUオフロード時 ~10-20 / 2×RTX 4090で ~30-35
70B 一台完結96GB 以上で可(¥67万〜)RTX 6000 Ada 48GB(¥80〜100万)で可。ただし帯域960 GB/sで遅め
消費電力システム全体 40〜80WGPU単体 350〜575W(電気代・冷却コスト大)
セットアップmacOS + Ollama DMG で即動作Windows/Linux + CUDAドライバ管理が必要
拡張性メモリ後付不可(購入時に決定)GPU追加・VRAM拡張が可能
安定性・運用macOS の安定性が高い。社内サーバー向きLinux運用推奨。ドライバ更新・冷却管理の手間あり
RAG用途の注意Embedding・Reranker・LLMが同一メモリ空間で競合 → 48GB以上で余裕が生まれるVRAMをLLMに全振り → Embeddingは別GPU or CPU処理が必要

4. 予算帯別推薦

予算推薦機種主な理由
〜45万Mac Studio M4 Max 48GB(#5・採用機)gemma3:27b を 30〜40 tok/s で安定運用。セットアップ簡単。電気代安
〜50万RTX 4090 BTO PCgemma3:27b なら 2〜3 倍速いが 70B は不可・Linux運用前提
〜70万Mac Studio M3 Ultra 96GB(#7)llama3.3:70b を 25〜35 tok/s で一台完結。70B前提なら最高コスパ
〜100万Mac Studio M3 Ultra 96GB(#8・上位GPU版)#7との性能差は小さい。RTX 5090 BTOも候補だが70B VRAM不足で非推奨

5. 採用構成の再確認

Mac Studio M4 Max 48GB が引き続き最適解である理由(2026年3月時点):

  • 本プロジェクトの用途(社内RAG・gemma3:27b推奨・100人規模)では 70B 必須ではない
  • ¥44万という予算で gemma3:27b / qwen2.5:32b を快適に運用できる
  • macOS の安定性・省電力(~50W)は社内サーバー運用に最適
  • 将来 70B が必要になった場合: M3 Ultra 96GB(¥67万)への買い替えが最善。RTX 5090 構成は VRAM 不足のため非推奨

MacBook Air M2 16GB での実測値(Step 7 / 2026-03-01)

本プロジェクトの開発・検証環境として使用した MacBook Air M2 16GB の実測値。

クエリEmbeddingRerankLLM生成合計tok/s
有給休暇は何日もらえますか?8.0s4.3s26.7s39.1s2.3
リモートワークの条件を教えてください35.4s4.1s30.7s70.4s1.9
育児休業はどのくらい取れますか?32.2s6.2s38.4s76.9s1.0
平均62.1s1.7

Embedding が 2〜3回目で 30秒超になるのはキャッシュ未活用(毎回ロード)が原因。Mac Studio M4 Max 採用環境では Embedding 常駐 + LLM 高速化で大幅改善見込み。


6. 情報の確度と情報源

情報確度情報源
Apple 製品の日本価格✅ 確実EveryMac.com・Apple Newsroom・Gigazine
RTX 5090 スペック✅ 確実NVIDIA公式
RTX 5090 BTO価格⚠️ 推定(変動あり)GDM.or.jp・SEVEN等
RTX 4090 BTO価格⚠️ 推定(生産終了・在庫僅少)databasemart.com
tok/s 数値⚠️ 推定(実測ベース)hardware-corner.net・databasemart.com・localllm.in
M4 Ultra / Mac Pro❌ 未確認(2026年3月時点で未発売)Macworld・AppleInsider(噂段階)