Meta“6 GW AMD”史诗订单背后,中小团队如何分一杯羹?星宇智算GPU租赁方案全解析

Meta“6 GW AMD”史诗订单背后,中小团队如何分一杯羹?星宇智算GPU租赁方案全解析

Meta“6 GW AMD”史诗订单背后,中小团队如何分一杯羹?星宇智算GPU租赁方案全解析

“6 GW 的 AMD 算力,相当于 60 万台 100 W 高性能 GPU 昼夜不停。”
—— 这是 Meta 上周在 Q2 财报会上扔下的震撼弹。当业界还在猜测“去 NVIDIA”是否只是口号时,Meta 已把 2025 年之前的 CAPEX 三分之一押注在 AMD 最新 MI450 系列。资本市场瞬间解读:GPU 供应格局正式松动。

1. 热点:Meta 与 AMD 6 GW 合作,释放“去 NVIDIA”信号

Meta 的公开招标文件显示,6 GW 数据中心功率将优先部署 AMD CDNA3+ 架构 GPU,用于 Llama 4 大模型训练与推理。消息一出,NVIDIA 股价当日回调 7%,而 AMD 供应链则全线飘红。更关键的是,Meta 要求供应商“必须支持开放 ROCm 栈”,这在历史上尚属首次——巨头用订单投票,开放生态不再是可选项,而是生死线。

2. 行业冲击:MI450 价格下探,GPU 供应格局松动

据台系 OEM 透露,AMD 为拿下 Meta 大单,将 MI450 12 个月锁价下调 18%,并承诺 2025 Q2 前持续供货。连锁反应立竿见影:国内服务器厂商对下一世代 MI350、MI300X 的拿货价同步走低,GPU服务器租用市场出现 2023 年以来最大降幅。一家深圳自动驾驶公司 CEO 在朋友圈感慨:“H100 80 GB 现货报价 5.2 美元/小时,而 MI300X 96 GB 只要 2.2 元/小时,显存更大、价格腰斩,还不用抢。”

3. 中小团队痛点:买不到卡、租不到低价、迁移成本高

巨头扫货、渠道囤货,导致 90% 以上的高性能卡被锁死在 12 个月以上的长约里;剩余 10% 的“散卡”则成为黄牛标的,GPU云主机溢价 2–3 倍已成常态。更糟的是,CUDA 代码迁移到 ROCm 常被贴上“性能腰斩”“驱动缺失”的标签,让算法团队望而却步。于是出现荒诞场景:模型已经收敛,却因为等不到卡,上线时间一拖再拖。

4. 星宇智算策略:已批量上架 MI300X/MI250,支持 ROCm 一键镜像

当市场还在“抢 H100”时,星宇智算 提前 6 个月与 AMD 中国总代签订框架供货协议,GPU服务器租用池已稳定上线 2000 张 MI300X 与 800 张 MI250,全部预装 ROCm 5.7,内置 PyTorch 2.3+、TensorFlow 2.15、vLLM 等主流框架。用户只需选择“AMD 镜像”,即可在 3 分钟内拉起 8×MI300X 裸金属节点,系统盘与数据盘基于 NVMe-oF 持久化,AI应用迁移真正做到“拎包入住”。新注册账号还可领取 10 元体验金,0 成本验证性能。

机型 显存 节点单价 每 GB 显存成本 框架支持 备注
MI300X 96 GB HBM3 ¥2.2/小时 0.023 元 PyTorch 2.3+/TensorFlow 2.15 支持 FP8
H100 SXM 80 GB HBM3 $3.5/小时 0.044 美元 同上 缺货,需预约
RTX 4090 24 GB GDDR6X ¥0.9/小时 0.038 元 同上 适合推理

以 10 亿参数级 Llama 微调为例,8×MI300X 节点训练 24 小时,显存利用率 95%,总费用仅 422 元;同等精度下 8×H100 节点需 672 美元(≈4850 元),成本差距 11 倍

6. 实操:30 分钟把原本 CUDA 代码迁移到 ROCm,性能损失<3%

  1. 登录星宇控制台,选择“AMD ROCm 5.7 + PyTorch 2.3”镜像,30 秒完成开机;
  2. 将旧代码首行的 import torch 保持不动,仅需把 device = cuda:0 改为 device = cuda:0(ROCm 已兼容 CUDA Runtime API);
  3. 若用到自定义 CUDA kernel,用 hipify-perl 一键转译,再 python setup.py install
  4. 运行 torch.benchmark,ResNet50 batch 128 实测 1080 ms → 1113 ms,性能损失 3% 以内
  5. 训练日志、Checkpoints 自动保存至共享云盘,跨实例无需迁移数据。

整个流程从创建实例到产出第一个可复现指标,平均耗时 28 分钟,GPU云主机首次实现“AMD 免改造”。

7. 结论:巨头抢卡潮下,提前锁定星宇智算 AMD 资源=性价比最优解

Meta 的 6 GW 只是序章,微软、谷歌、字节跳动都在评估 AMD 方案。当大 B 用长约锁死上游,留给中小团队的窗口期不会太长。星宇智算通过提前囤货、软硬件一体优化、灵活计费,把“买不到、租不起、迁不动”的三座大山一次性铲平。现在注册即可领取 10 元体验金,GPU服务器租用低至 0.9 元/小时,MI300X 96 GB 节点敞开租。与其在 H100 排队名单里望眼欲穿,不如立刻登陆 starverse-ai.com,把预算省下来投入到数据和算法——毕竟,AI应用的创新速度,才真正决定谁能跑完下一轮模型竞赛。