Meta“6 GW AMD”史诗订单背后，中小团队如何分一杯羹？星宇智算GPU租赁方案全解析 – 资讯及公告 – 星宇智算

“6 GW 的 AMD 算力，相当于 60 万台 100 W 高性能 GPU 昼夜不停。”
—— 这是 Meta 上周在 Q2 财报会上扔下的震撼弹。当业界还在猜测“去 NVIDIA”是否只是口号时，Meta 已把 2025 年之前的 CAPEX 三分之一押注在 AMD 最新 MI450 系列。资本市场瞬间解读：GPU 供应格局正式松动。

1. 热点：Meta 与 AMD 6 GW 合作，释放“去 NVIDIA”信号

Meta 的公开招标文件显示，6 GW 数据中心功率将优先部署 AMD CDNA3+ 架构 GPU，用于 Llama 4 大模型训练与推理。消息一出，NVIDIA 股价当日回调 7%，而 AMD 供应链则全线飘红。更关键的是，Meta 要求供应商“必须支持开放 ROCm 栈”，这在历史上尚属首次——巨头用订单投票，开放生态不再是可选项，而是生死线。

2. 行业冲击：MI450 价格下探，GPU 供应格局松动

据台系 OEM 透露，AMD 为拿下 Meta 大单，将 MI450 12 个月锁价下调 18%，并承诺 2025 Q2 前持续供货。连锁反应立竿见影：国内服务器厂商对下一世代 MI350、MI300X 的拿货价同步走低，GPU服务器租用市场出现 2023 年以来最大降幅。一家深圳自动驾驶公司 CEO 在朋友圈感慨：“H100 80 GB 现货报价 5.2 美元/小时，而 MI300X 96 GB 只要 2.2 元/小时，显存更大、价格腰斩，还不用抢。”

3. 中小团队痛点：买不到卡、租不到低价、迁移成本高

巨头扫货、渠道囤货，导致 90% 以上的高性能卡被锁死在 12 个月以上的长约里；剩余 10% 的“散卡”则成为黄牛标的，GPU云主机溢价 2–3 倍已成常态。更糟的是，CUDA 代码迁移到 ROCm 常被贴上“性能腰斩”“驱动缺失”的标签，让算法团队望而却步。于是出现荒诞场景：模型已经收敛，却因为等不到卡，上线时间一拖再拖。

4. 星宇智算策略：已批量上架 MI300X/MI250，支持 ROCm 一键镜像

当市场还在“抢 H100”时，星宇智算提前 6 个月与 AMD 中国总代签订框架供货协议，GPU服务器租用池已稳定上线 2000 张 MI300X 与 800 张 MI250，全部预装 ROCm 5.7，内置 PyTorch 2.3+、TensorFlow 2.15、vLLM 等主流框架。用户只需选择“AMD 镜像”，即可在 3 分钟内拉起 8×MI300X 裸金属节点，系统盘与数据盘基于 NVMe-oF 持久化，AI应用迁移真正做到“拎包入住”。新注册账号还可领取 10 元体验金，0 成本验证性能。

机型	显存	节点单价	每 GB 显存成本	框架支持	备注
MI300X	96 GB HBM3	￥2.2/小时	0.023 元	PyTorch 2.3+/TensorFlow 2.15	支持 FP8
H100 SXM	80 GB HBM3	$3.5/小时	0.044 美元	同上	缺货，需预约
RTX 4090	24 GB GDDR6X	￥0.9/小时	0.038 元	同上	适合推理

以 10 亿参数级 Llama 微调为例，8×MI300X 节点训练 24 小时，显存利用率 95%，总费用仅 422 元；同等精度下 8×H100 节点需 672 美元（≈4850 元），成本差距 11 倍。

6. 实操：30 分钟把原本 CUDA 代码迁移到 ROCm，性能损失<3%

登录星宇控制台，选择“AMD ROCm 5.7 + PyTorch 2.3”镜像，30 秒完成开机；
将旧代码首行的 import torch 保持不动，仅需把 device = cuda:0 改为 device = cuda:0（ROCm 已兼容 CUDA Runtime API）；
若用到自定义 CUDA kernel，用 hipify-perl 一键转译，再 python setup.py install；
运行 torch.benchmark，ResNet50 batch 128 实测 1080 ms → 1113 ms，性能损失 3% 以内；
训练日志、Checkpoints 自动保存至共享云盘，跨实例无需迁移数据。

整个流程从创建实例到产出第一个可复现指标，平均耗时 28 分钟，GPU云主机首次实现“AMD 免改造”。

7. 结论：巨头抢卡潮下，提前锁定星宇智算 AMD 资源=性价比最优解

Meta 的 6 GW 只是序章，微软、谷歌、字节跳动都在评估 AMD 方案。当大 B 用长约锁死上游，留给中小团队的窗口期不会太长。星宇智算通过提前囤货、软硬件一体优化、灵活计费，把“买不到、租不起、迁不动”的三座大山一次性铲平。现在注册即可领取 10 元体验金，GPU服务器租用低至 0.9 元/小时，MI300X 96 GB 节点敞开租。与其在 H100 排队名单里望眼欲穿，不如立刻登陆 starverse-ai.com，把预算省下来投入到数据和算法——毕竟，AI应用的创新速度，才真正决定谁能跑完下一轮模型竞赛。