ハードウェア比較（拡張版）

最終更新: 2026-03-03 対象予算: 30〜100万円（参考として100万円超の機種も掲載） 目的: PLAN_01「採用機種の選定経緯」の補足。Mac Studio M3 Ultra・Mac Pro・NVIDIA GPUを含めた詳細比較。

1. ハードウェア詳細比較表

LLM推論速度の最大のボトルネックは メモリ帯域幅。帯域が広いほどトークン生成が速い。

#	機種	チップ	VRAM/メモリ	帯域	概算価格	OS	推奨LLM	tok/s（概算）	採用
1	Mac mini	M4 Pro 12C/16G	24GB	273 GB/s	~¥219,000	macOS	gemma3:12b	~25	— VRAM不足
2	Mac mini	M4 Pro 14C/20G	48GB	273 GB/s	~¥339,000	macOS	qwen2.5:32b	~15	— 帯域がボトルネック
3	RTX 4090 BTO PC	Core i9 + RTX 4090	24GB VRAM	1,008 GB/s	~¥500,000	Win/Linux	gemma3:27b	~80-100	— 70B CPUオフロード必須
4	Mac Studio M4 Max	M4 Max 14C/32G	36GB	410 GB/s	~¥329,000	macOS	gemma3:27b	~20-28	— メモリ余裕が少ない
5	Mac Studio M4 Max	M4 Max 16C/40G	48GB	546 GB/s	~¥445,000	macOS	gemma3:27b	~30-40	✅ 採用
6	Mac Studio M4 Max	M4 Max 16C/40G	96GB	546 GB/s	~¥800,000	macOS	llama3.3:70b	~15-20	— 70B可だがコスパ悪
7	Mac Studio M3 Ultra	M3 Ultra 28C/60G	96GB	819 GB/s	~¥669,000	macOS	llama3.3:70b	~25-35	🔁 70B最高コスパ候補
8	Mac Studio M3 Ultra	M3 Ultra 32C/80G	96GB	819 GB/s	~¥894,000	macOS	llama3.3:70b	~30-38	— #7と性能差小
9	RTX 5090 BTO PC	Core Ultra + RTX 5090	32GB VRAM	1,792 GB/s	~¥1,000,000	Win/Linux	gemma3:27b	~80-100	— 70B VRAM不足

⚠️ 価格・tok/s はいずれも概算・推定値（2026-03-03時点）。 特に BTO PC 価格は在庫状況で変動。

機種	メモリ	帯域	概算価格	備考
Mac Studio M3 Ultra 192GB	192GB	819 GB/s	~¥110〜150万（推定）	70B + 大コンテキストが安心
2× RTX 4090 PC	48GB VRAM合計	1,008 GB/s × 2	~¥100〜150万	PCIeボトルネックあり・NVLink非対応
RTX 6000 Ada workstation	48GB VRAM	960 GB/s	~¥80〜100万	ECC対応・プロ向け・推論速度はRTX 4090より遅い
Mac Pro M4 Ultra	未定	~1,092 GB/s（推定）	未定	M4 UltraはUltraFusion未実装のため2026年3月時点では未発売

どのモデルを動かしたいかで必要な機種が決まる。

モデル	パラメータ	Q4_K_M サイズ	最小メモリ	推奨機種	備考
gemma3:12b	12B	~8GB	16GB	Mac mini 24GB〜、RTX 4080 12GB〜	本プロジェクト実績: MacBook Air M2 16GBで動作確認済み
gemma3:27b	27B	~17GB	24GB	Mac Studio M4 Max 36GB〜、RTX 4090 24GB	24GBはKVキャッシュで逼迫。36GB以上推奨
qwen2.5:32b	32B	~19GB	24GB	Mac Studio M4 Max 36GB〜、RTX 4090 24GB	24GBでは実質コンテキスト制限が必要
llama3.3:70b	70B	~43GB	48GB	M4 Max 96GB・M3 Ultra 96GB・2×RTX 4090	単体RTX 5090(32GB)・RTX 4090(24GB)ではCPUオフロード必須で大幅速度低下
qwen2.5:72b	72B	~43GB	48GB	同上	同上

48GB が 70B モデルの実質的な最小閾値。 70B を快適に動かすには予算 ¥67万〜（Mac Studio M3 Ultra 96GB）が必要。

観点	Apple Silicon	NVIDIA GPU（RTX 4090/5090）
27B モデル（tok/s）	~30-40（M4 Max）	~80-100（2〜3倍速い）
70B モデル（tok/s）	~25-35（M3 Ultra 96GB）	CPUオフロード時 ~10-20 / 2×RTX 4090で ~30-35
70B 一台完結	96GB 以上で可（¥67万〜）	RTX 6000 Ada 48GB（¥80〜100万）で可。ただし帯域960 GB/sで遅め
消費電力	システム全体 40〜80W	GPU単体 350〜575W（電気代・冷却コスト大）
セットアップ	macOS + Ollama DMG で即動作	Windows/Linux + CUDAドライバ管理が必要
拡張性	メモリ後付不可（購入時に決定）	GPU追加・VRAM拡張が可能
安定性・運用	macOS の安定性が高い。社内サーバー向き	Linux運用推奨。ドライバ更新・冷却管理の手間あり
RAG用途の注意	Embedding・Reranker・LLMが同一メモリ空間で競合 → 48GB以上で余裕が生まれる	VRAMをLLMに全振り → Embeddingは別GPU or CPU処理が必要

予算	推薦機種	主な理由
〜45万	Mac Studio M4 Max 48GB（#5・採用機）	gemma3:27b を 30〜40 tok/s で安定運用。セットアップ簡単。電気代安
〜50万	RTX 4090 BTO PC	gemma3:27b なら 2〜3 倍速いが 70B は不可・Linux運用前提
〜70万	Mac Studio M3 Ultra 96GB（#7）	llama3.3:70b を 25〜35 tok/s で一台完結。70B前提なら最高コスパ
〜100万	Mac Studio M3 Ultra 96GB（#8・上位GPU版）	#7との性能差は小さい。RTX 5090 BTOも候補だが70B VRAM不足で非推奨

Mac Studio M4 Max 48GB が引き続き最適解である理由（2026年3月時点）:

本プロジェクトの開発・検証環境として使用した MacBook Air M2 16GB の実測値。

クエリ	Embedding	Rerank	LLM生成	合計	tok/s
有給休暇は何日もらえますか？	8.0s	4.3s	26.7s	39.1s	2.3
リモートワークの条件を教えてください	35.4s	4.1s	30.7s	70.4s	1.9
育児休業はどのくらい取れますか？	32.2s	6.2s	38.4s	76.9s	1.0
平均				62.1s	1.7

Embedding が 2〜3回目で 30秒超になるのはキャッシュ未活用（毎回ロード）が原因。Mac Studio M4 Max 採用環境では Embedding 常駐 + LLM 高速化で大幅改善見込み。

情報	確度	情報源
Apple 製品の日本価格	✅ 確実	EveryMac.com・Apple Newsroom・Gigazine
RTX 5090 スペック	✅ 確実	NVIDIA公式
RTX 5090 BTO価格	⚠️ 推定（変動あり）	GDM.or.jp・SEVEN等
RTX 4090 BTO価格	⚠️ 推定（生産終了・在庫僅少）	databasemart.com
tok/s 数値	⚠️ 推定（実測ベース）	hardware-corner.net・databasemart.com・localllm.in
M4 Ultra / Mac Pro	❌ 未確認（2026年3月時点で未発売）	Macworld・AppleInsider（噂段階）