
从 Earth-2 气象大模型到城市级数字孪生,星宇智算助力「AI 智算」落地
“当 2 km 分辨率的可微分天气模型开源,128 张 A100 的并行推理像一场 90 分钟的雷暴——算力就是第一滴雨。”
① 气象进入“公里级”时代,算力门槛陡增
2024 年 6 月,NVIDIA 把 Earth-2 推向 GitHub:全球首个可微分数值天气系统,空间分辨率下探 2 km,单次 72 h 集合预报需 128 张 GPU 并行 6 小时。
传统机房若用 10G 以太网,跨节点梯度同步延迟高达 6 ms,IO 瓶颈让“公里级”沦为“幻灯片级”。公共云虽能租卡,却常把 A100 拆成 1/2 或 1/4 物理切片,带宽与显存同步缩水,模型一跑就“掉帧”。
② 星宇智算:把“超算”做成“水电”
面对高 IO、低延迟、多节点 GPU 池化的刚性需求,星宇智算 直接把 IDC 搬进国家骨干网节点:
– 100 Gbps RDMA 网络,延迟 < 2 µs,梯度同步比本地 NVLink 只差一个数量级;
– NVSwitch 全互联,512 卡以内单集群,All-Reduce 带宽保持 2.4 TB/s;
– GPU服务器租用 按“任务”计费,1 张 A100 1.8 元/时起,72 小时台风预报最低 1382 元,不到自建机房 5 % 成本;
– 系统盘免费赠送 1 TB 持久化云存储,模型 checkpoint 跨实例秒级挂载,断点续训零丢失。
新用户注册即送 10 元体验金,可零成本跑通 Earth-2 官方 Demo,10 分钟完成 24 km 分辨率测试。
③ 省气象局实战:6 小时写完 72 小时“台风剧本”
东南某省气象局原先依托本地小型 GPU 云主机,72 h 集合成员仅 20 个,平均路径误差 108 km。
迁移到星宇智算后,工程师通过控制台一键拉起 128 卡 A100 集群,采用 Earth-2 官方 Docker 镜像,内置的 NCCL 参数已针对 RDMA 调优,无需二次开发。
– 集合成员扩充至 50 个;
– 推理时长从 26 h 压缩到 6 h;
– 平均路径误差降至 87 km,降幅 19 %;
– 单次任务费用 1382 元,比采购 8 张 A100 节省 92 万元资本开支。
“以前买卡要等财政招标,现在信用卡就能出预报。”项目负责人在复盘会上如是说。
④ 从气象到城市:数字孪生“模板化”复制
Earth-2 只是起点。星宇智算把港口船舶密度、高架车流、应急疏散算法打包成AI应用模板,用户像安装手机 App 一样点击“部署”,系统自动分配 GPU 规模:
– 港口台风避险:10 卡 A100,30 分钟完成 72 h 船舶轨迹重规划;
– 高架桥风荷载仿真:4 卡 RTX 4090,1 小时输出 3 万个桥段的风压云图;
– 城市内涝应急:64 卡 A100,2 小时跑完 50 年一遇暴雨积水模型。
所有模板内置公开数据集与可视化代码,科研团队只需替换本地观测,即可在 24 小时内交付决策报告。
⑤ 生态愿景:让公共部门享受“超算级”水电
星宇智算正把“PaaS 平台 + 自营精品 SaaS + 开放生态”做成三级火箭:
– 对需求方:像刷短视频一样订阅GPU云主机与 AI 应用,成本可视,性能可测;
– 对创作者:提供“拎包入住”的开发者中心,模型上架即自动镜像化,平台负责计费和分销,创作者分成 70 %;
– 对产业:与气象局、交通局、应急厅共建“行业算力池”,把 Earth-2、Traffic-2、Flood-2 串成一站式城市数字孪生操作系统。
未来三年,星宇智算计划接入 10 EFLOPS 规模的国产与进口 GPU,把“AI 智算”做成公共基础设施,让每一级政府、每一家初创公司、每一位研究者都能像开水龙头一样,拧开就算。
立即体验
现在注册 星宇智算,新用户立得 10 元体验金,可 0 成本跑通 Earth-2 官方 Demo,或一键部署港口、交通、应急等数字孪生模板。
把复杂的并行计算留给我们,把创新的想象力留给自己——下一个“公里级”突破,或许就诞生在你的浏览器里。
