ハードウェア比較(拡張版)
最終更新: 2026-03-03 対象予算: 30〜100万円(参考として100万円超の機種も掲載) 目的: PLAN_01「採用機種の選定経緯」の補足。Mac Studio M3 Ultra・Mac Pro・NVIDIA GPUを含めた詳細比較。
1. ハードウェア詳細比較表
LLM推論速度の最大のボトルネックは メモリ帯域幅。帯域が広いほどトークン生成が速い。
予算内機種(30〜100万円)
⚠️ 価格・tok/s はいずれも概算・推定値(2026-03-03時点)。 特に BTO PC 価格は在庫状況で変動。
参考(予算外: 100万円超)
2. LLMモデル別必要スペック
どのモデルを動かしたいかで必要な機種が決まる。
48GB が 70B モデルの実質的な最小閾値。 70B を快適に動かすには予算 ¥67万〜(Mac Studio M3 Ultra 96GB)が必要。
3. Apple Silicon vs NVIDIA 実用比較
4. 予算帯別推薦
5. 採用構成の再確認
Mac Studio M4 Max 48GB が引き続き最適解である理由(2026年3月時点):
- 本プロジェクトの用途(社内RAG・gemma3:27b推奨・100人規模)では 70B 必須ではない
- ¥44万という予算で gemma3:27b / qwen2.5:32b を快適に運用できる
- macOS の安定性・省電力(~50W)は社内サーバー運用に最適
- 将来 70B が必要になった場合: M3 Ultra 96GB(¥67万)への買い替えが最善。RTX 5090 構成は VRAM 不足のため非推奨
MacBook Air M2 16GB での実測値(Step 7 / 2026-03-01)
本プロジェクトの開発・検証環境として使用した MacBook Air M2 16GB の実測値。
Embedding が 2〜3回目で 30秒超になるのはキャッシュ未活用(毎回ロード)が原因。Mac Studio M4 Max 採用環境では Embedding 常駐 + LLM 高速化で大幅改善見込み。