数据中心 GPU 怎么买?H100 / H200 / A100 / H20 国内采购避坑(2026)
企业级 AI 训练/推理 GPU 国内采购全攻略。H100、H200、A100、H20、L40S 规格与适用场景对比,出口管制下的合规选择,国行 vs 水货风险,整机散热电源配套与采购建议。
「要搭个大模型训练/推理集群,GPU 到底买 H100、H200 还是 A100?水货能不能碰?」
数据中心 GPU 采购水很深:型号选错,训练跑不动或推理成本翻倍;渠道选错,买到没保修、被锁卡、甚至合规出问题的水货。
这篇把主流数据中心 GPU 的型号、适用场景、合规渠道、整机配套一次讲清。
一、主流数据中心 GPU 一张表
| 型号 | 显存 | 互联 | 强项 | 适合 |
|---|---|---|---|---|
| H200 | 141GB HBM3e | NVLink(SXM) | 大模型训练/长上下文推理,显存最大 | 训练大参数、长上下文推理 |
| H100 | 80GB HBM3 | NVLink(SXM/PCIe) | 训练性能标杆 | 大规模训练 |
| A100 | 40/80GB HBM2e | NVLink | 上一代主力,性价比 | 训练/推理通用、预算有限 |
| H20 | 96GB HBM3 | NVLink | 面向中国市场的合规 Hopper,算力受限但显存大、带宽高,推理友好 | 国内合规采购、推理为主 |
| L40S / L20 | 48GB / 48GB | PCIe | 推理 + 图形 + 中等训练,性价比 | 推理、微调、多卡推理 |
| RTX 4090 / 5090 | 24/32GB | 无 NVLink | 单卡开发、小模型微调 | 个人/小团队起步 |
规格随产品迭代会变,算力/显存/带宽以 NVIDIA 官方最新 datasheet 为准;价格行情波动大,务必以实时正规报价为准。
二、出口管制:先搞清楚什么能合规买
- H100 / H200 / A100 属于对华出口管制范围,正规合规渠道在国内不直接销售给一般企业
- NVIDIA 面向中国市场推出合规型号(如 H20、L20 等),算力被限制但可正规采购
- 市面上确有 H100/H200「水货」,但没有官方保修、来源不明、可能被 BIOS 锁或后续禁用、且有合规风险
结论:要稳、要保修、要合规 → 优先 H20 / L40S / L20 / A100(正规渠道库存);追极致训练性能且能承担水货风险 → 自行评估,我们建议合规优先。
三、SXM vs PCIe,别买错形态
| 维度 | SXM(如 H100 SXM) | PCIe(如 H100 PCIe / L40S) |
|---|---|---|
| 互联 | NVLink/NVSwitch,多卡高带宽 | 走 PCIe,多卡带宽低 |
| 整机 | 必须用专用 8 卡服务器(HGX 平台) | 普通 GPU 服务器即可插 |
| 适合 | 大规模分布式训练 | 推理、单机多卡、灵活扩展 |
| 成本/门槛 | 高(整机贵) | 相对低、灵活 |
判断:多机多卡大训练 → SXM/HGX 整机;推理、微调、灵活上卡 → PCIe。
四、别只买卡,整机配套才是坑
一张数据中心 GPU 几万到几十万,配套没做好等于白买:
- 电源:8 卡服务器整机功耗常 4-6kW,机房供电/PDU 要够
- 散热:高密度多卡必须风冷强散热或液冷,普通机箱压不住(见我们《多卡服务器散热:风冷 vs 液冷》)
- CPU / 内存 / 存储:训练要喂得动数据,CPU、内存带宽、NVMe 高速存储要配齐
- 网络:多机训练要 IB / RoCE 高速网络,否则多机扩展打折扣
- 机房:承重、空调制冷、UPS 都要提前评估
五、5 个采购踩坑
❌ 坑 1:只看算力不看显存
显存装不下模型 = 跑不起来。大参数/长上下文优先看显存(H200 141GB、H20 96GB)。
❌ 坑 2:买了 SXM 卡却没有 HGX 整机
SXM 卡不能随便插普通服务器,必须配套专用平台,预算要算整机。
❌ 坑 3:水货当国行买
没保修、来源不明、可能被锁/禁用,且合规存疑。企业采购建议走合规渠道。
❌ 坑 4:忽略散热和供电
高密度多卡不解决散热/供电,轻则降频、重则宕机损卡。
❌ 坑 5:推理场景上了训练旗舰卡
纯推理用 H100/H200 是浪费,L40S / H20 / 多卡 L20 性价比更高。
六、按场景选型
个人 / 小团队起步、做开发和小模型微调
👉 RTX 4090 / 5090 工作站(1-4 卡)
中小企业推理 / 微调为主
👉 L40S / L20 / H20 多卡服务器(PCIe)
- 显存大、合规、性价比高
中大企业训练 + 推理混合
👉 A100 / H20 多机多卡,按预算与合规取舍
大规模分布式训练
👉 HGX SXM 8 卡整机 + IB 高速网络
- 整机 + 散热 + 网络一体规划
写在最后
我们提供 AI 工作站 / GPU 服务器整机定制:
- 合规优先的 GPU 选型建议(H20 / L40S / L20 / A100 等),按你的训练 or 推理场景配
- 整机交付:卡 + 服务器 + 散热(风冷/液冷)+ 供电 + 高速网络一站配齐
- 机房评估:承重、制冷、供电、UPS 一并规划,避免买了卡上不了架
- 从单机到集群:1 卡工作站到 8 卡整机到多机训练集群
或先看 AI 工作站 / 深度学习主机。相关:RTX 4090 vs A6000 vs L40S 横评、多卡服务器散热:风冷 vs 液冷。
下载《数据中心 GPU 怎么买?H100 / H200 / A100 / H20 国内采购避坑(2026)》PDF 完整版
留下邮箱,立刻获取本文 PDF + 后续企业 AI / 软件采购干货
- ✓ 含全部图表、检查清单、参考链接
- ✓ 可用于内部分享 / 招投标资料引用
- ✓ 后续更新自动推送 · 不发垃圾邮件
想把这些经验落到你的企业?
1 个工作日内出方案 / 报价 · 可签 NDA · 支持招投标
相关文章
Windows 与 Windows Server 授权怎么买?VL / OEM / 订阅 / CAL 避坑指南
Windows 11 企业版与 Windows Server 2022/2025 正版授权全攻略。讲清 OEM、批量授权 VL、订阅三种买法,Server 按核心授权 + CAL 的坑,Standard vs Datacenter 怎么选。
企业私有部署 DeepSeek / Qwen:模型选型 + 硬件 + 成本测算(2026)
开源大模型私有化部署完全指南。DeepSeek、Qwen、GLM 等模型怎么选,不同参数规模需要多少显存/几张卡,量化怎么省显存,vLLM/Ollama 部署方式,自建 vs API 成本对比。
Office 买断版 vs Microsoft 365 订阅,企业到底怎么选?(2026)
Office 2024 买断 vs Microsoft 365 订阅全对比。从价格模型、功能差异、协作云服务、合规风险到按规模选型,一篇讲清企业该买哪个,附 5 个常见踩坑。
