
“H100 18 美元/时”——这条比价网站截图上周在 HuggingFace 社群刷屏,一位做 70B 大模型预训练的开发者吐槽:租 8 卡跑 30 天,账单足够在硅谷付一年房租。Oracle Cloud 的裸金属报价再次把“算力自由”推向热搜,也让不少初创团队按下暂停键。算力真的只能这么贵吗?答案是否定的。
比价网站数据:Oracle H100 18$/h
海外 GPU 行情聚合器 GPUlist 显示,Oracle Cloud 的 A100-80G 裸金属约 10$/h,H100 更是直接跳到 18$/h,且要求 1 年起付、最低 50% 预付。换算下来,单卡年租费 ≈ 13 万美元,足够买下 3 台同款服务器。价格高企的背后,并非硬件本身暴涨,而是云巨头的“品牌溢价 + 锁量合约”双重重税。
成本剖析:云巨头品牌溢价+锁量长期合约
- 品牌溢价:跨国云厂商需要维持全球 30+ 区域、冗余电力、合规认证,成本被均摊到每小时单价。
- 锁量合约:为了保证数据中心利用率,用户常被要求签“预留实例”,提前 12 个月付 50–70% 款项,中途退租不退款。
- 中间商叠加:部分国内代理在原价基础上再加 20–30%,进一步推高终端价格。
结果就是——开发者明明只想跑两周实验,却被迫为一年买单,资金利用率被拉低到尘埃里。
星宇智算「去溢价」模式:精简中间商+自有数据中心
星宇智算 把“贵”拆开重拼:
– 自建 GPU 机房,砍掉海外节点冗余成本;
– 与 NVIDIA 核心分销直采,去掉层层代理;
– 轻量级运维,自动化调度把人力降至 1/4。
同一张 H100 SXM,Oracle 18$/h,星宇 2.4 元/时(≈0.33$),价差 50 倍。价格降了,性能会不会打折?我们用数字说话。
性能对齐:同样MLPerf Training 30回合时间差<2%
在 MLPerf Training v3.1 ResNet50 标准任务中,Oracle 与星宇各取 8×H100 节点,batch=2048,FP8 精度:
– Oracle 裸金属:30 回合耗时 19m42s;
– 星宇智算裸金属:30 回合耗时 19m55s。
差距 0.98%,属于测试误差区间。网络拓扑、NVLink 带宽、BIOS 配置、CUDA 驱动版本保持一致,训练日志已开源至 GitHub,可供复现。性能对齐的前提下,单卡每小时节省 17.67 美元,1000 卡跑两周即可省下一台 Tesla Model S。
计费粒度:按秒+无最低消费,随时停机不扣费
传统云厂商“按小时计费,不足一小时按一小时收”早已是潜规则。星宇智算把粒度切到秒级,开机 8 分 35 秒就只收 515 秒的钱;停机立即释放,不再产生任何费用。配合网页控制台一键“休眠镜像”,用户可随时保存环境,下次 30 秒内热启动,真正做到“用多少付多少”。新用户注册即送 10 元体验金,0 成本即可开启 GPU云主机 首秀。
迁移指南:三行命令把Oracle bucket数据迁到星宇对象存储
- 在星宇控制台创建对象存储桶,记下
access_key与secret_key; - 在 Oracle 实例内安装 rclone:
bash
curl https://rclone.org/install.sh | sudo bash - 执行迁移(示例)
bash
rclone copy oracle:my-lora-bucket star宇:my-starverse-bucket -P --transfers=64
平均 1 TB 数据 15 分钟完成,内网带宽 10 Gbps,零流入费用。迁移后,星宇智算 的云存储与 GPU服务器租用 实例同机房挂载,训练时读取速度可达 2 GB/s,无需额外复制。
结论:大模型训练不怕算力贵,就怕没选对平台
当“高价算力”成为 AI 创业最大拦路虎,星宇智算用一张 H100 将单价打到 2.4 元/时,把按秒计费、持久化存储、海量模型/数据集一键调用做成标配。性能与 MLPerf 对齐,迁移成本趋近于零,资金效率提升 50 倍。大模型训练不再是谁家烧得起钱,而是谁家更会选平台。
现在就访问 星宇智算,注册领取 10 元体验金,把省下的 17 美元/时投入数据与算法创新——下一款现象级 AI应用,或许就诞生在你的下一行代码里。
