Sora级文生视频热潮来袭，星宇智算H100节点按小时租打破算力壁垒 – 资讯及公告 – 星宇智算

“如果今天你还在为一张 H100 找关系，明天可能连故事板都落后别人一个版本。”
——某一线视效工作室 TD 在 SIGGRAPH 2023 上的吐槽

从“一卡难求”到“按小时开机”

过去三个月，GPT-4o、Sora、可灵、Vidu 等文生视频模型接连炸场，参数量集体冲破 100 亿，单模型显存峰值≥80 GB。影视、广告、短剧团队想把 15 秒 Demo 变成 4K 60 fps 正片，就必须在 DiT、W.A.L.T 这类时空扩散网络上做大规模连续训练。于是，H100 80 GB 成为硬通货——线下渠道价一天三跳，包年预付动辄百万起跳，交付周期 8 周以上。算力壁垒，直接把“创意”卡成了“排队”。

星宇智算上架 H100 NVL 裸金属，8～32 卡弹性组网

星宇智算本周正式上架 NVIDIA H100 NVL 裸金属节点，单机 8 卡起租，最高可弹性扩展至 32 卡无阻塞 NVLink 域，支持 PCI-E 5.0 与第四代 InfiniBand 400 Gbps 双平面组网。与常规 GPU云主机不同，裸金属直接透出 GPU 与 NUMA 拓扑，训练框架可零损耗调用 TransformerEngine、FP8 精算单元，真正做到“单机即集群”。平台同时提供
– 视频解码加速包：8 路 4K60 硬件解码通道，预装 FFmpeg 6.1、CV-CUDA、NVDEC 管线；
– 分布式并行存储：3 节点 100 TB NVMe RDMA 池，单客户端 25 GB/s 持续写带宽，Check-point 落盘时间缩短 58%；
– 跨实例云硬盘：训练数据与模型权重可在多组 H100 裸金属间热插拔挂载，无需重复上传。

实测：DiT-1.2B 单步迭代缩短 42%

我们选用开源 DiT-1.2B（max-seq 4096，fp16+bf16 混合）在 16 卡 H100 NVL 环境进行基准测试：
– 原生框架 + A100 80 GB：单步迭代 2.37 s
– 迁移至星宇智算 H100 NVL + FP8 + TransformerEngine：单步迭代 1.37 s
– 加速比 42%，千卡规模外推可节省约 18 万元电费/月

剧组模式：按“拍摄日”计费，闲置归零

传统云厂商包月/包年模式对影视剧组极不友好——拍一天、停三天，GPU 空转照样扣费。星宇智算推出「剧组模式」：
– 以自然日为粒度结算，开机才计费，关机立即释放；
– 支持现场 Storyboard 修改触发增量训练，30 分钟内完成环境克隆；
– 提供一键打包的“模型+解码+渲染”镜像，现场 DIT 可直接调用。

开发者生态：模型、数据集、云存储一次配齐

除了硬件，星宇智算还内置了三大资源池：
1. 模型仓库：Stable Video Diffusion、AnimateDiff、Sora-LoRA 等 140+ 公共 checkpoint，开机即挂载；
2. 数据集市场：WebVid-10M、HD-VG-130M、自建 4K 民族风语料，授权链路清晰；
3. 持久化云存储：训练结果自动同步，支持回滚至任意迭代步数，跨地域容灾三副本。

十分钟上手：注册就送 10 元体验金

打开星宇智算 GPU服务器租用官网，手机号注册即得 10 元体验金，可抵扣 1 小时 8 卡 H100 NVL；
控制台选择「AI应用」-「文生视频-DiT」，系统自动拉取镜像、挂载数据集；
点击「开机」，SSH 免密登录，默认已装好 PyTorch 2.3、CUDA 12.2、NVIDIA Driver 535；
训练完毕关机，账单按秒出账，余额透明。

写在最后

当“视频内容即广告，广告即电商”成为默认剧本，谁能先让 100 亿参数模型跑起来，谁就能把 15 秒创意变成 15 亿播放量。星宇智算用裸金属 H100 NVL 节点 + 按小时计费，把百万级预付砍成千元级现金流动，让剧组、工作室、独立开发者都能坐上 Sora 级文生视频的快车。
现在就去星宇智算注册，领取 10 元体验金，开机你的第一部 AI 大片吧。