Gorilla Tech东南亚GPU-as-a-Service启示录:星宇智算如何把“重资产”变“轻订阅”

Gorilla Tech东南亚GPU-as-a-Service启示录:星宇智算如何把“重资产”变“轻订阅”

Gorilla Tech东南亚GPU-as-a-Service启示录:星宇智算如何把“重资产”变“轻订阅”

Gorilla Tech东南亚GPU-as-a-Service启示录:星宇智算如何把“重资产”变“轻订阅”

热点速递
近日,新加坡Gorilla Technology在Q1财报中首次披露“phased GPU数据中心”计划——12.5MW机柜将按季度逐级上线,目标直指东南亚爆发式增长的AIGC与金融渲染需求。消息一出,资本市场迅速给出反馈:当日股价收涨18.7%,市值一夜新增3.4亿美元。
然而,狂欢背后,财报附注里一行小字却刺痛了老IT人的神经——“首期资本支出预计5,200万美元,折旧周期5年,闲置率预估38%”。重资产、长周期、高闲置,依旧是GPU算力逃不开的魔咒。


自建机房:一场“三高一长”的豪赌

“我们去年咬牙买了8张A100,自建机柜落地整整花了180万元,结果大模型热度一过,机器空转4个月,电费还要照交。”一位深圳AI初创CEO在社群吐槽。
这不是孤例。IDC《2023中国AI算力报告》显示,国内中小企业GPU资源平均闲置率>40%,CAPEX(一次性资本支出)占比高达总支出的67%,而交付周期动辄3-6个月。
更尴尬的是,硬件一落地就面临“技术债”:驱动升级、CUDA版本迭代、PyTorch生态碎片化……团队一半时间不是跑模型,而是调机器。
当“算力自由”变成“算力囚笼”,市场开始呼唤一种轻资产、快交付、按用量计费的新范式。


星宇智算:把“重”算力切成“轻”订阅

“我们要做的,就是AI时代的水电站:阀门一开,算力即来。”厦门星宇智算智能科技有限公司COO王淼在媒体开放日如是比喻。
基于这一理念,星宇智算推出GPU服务器租用服务,将传统“买断”模式拆解为1小时起订、随开随停、分钟级交付的“轻订阅”方案:

维度 自建8卡A100机柜 星宇智算GPU云主机(年付)
一次性CAPEX ¥180万 0
年付OPEX ¥21万(电费+运维) ¥9.9万
交付周期 90-180天 5分钟
闲置风险 高(>40%) 0,按需关机不计费
技术生态 自建 预装CUDA、PyTorch、Transformers

“我们把折旧成本、机房租金、运维人力全部打包进订阅费,用户只需关心模型精度。”王淼透露,上线半年,平台已吸引超1,200名AI开发者,平均为客户节省72%的算力总拥有成本(TCO)ROI周期从3年压缩到3个月


不止于“租机器”,更是“AI应用一键即玩”

如果只是“低价租卡”,星宇智算顶多算云厂商的“价格屠夫”。真正让它出圈的,是PaaS+SaaS双轮驱动的生态:

  1. 资源池即开即用
    平台内置50+公共大模型(Llama-3、ChatGLM-4、Stable Diffusion XL)、300+高质量数据集(Common Crawl清洗版、中文医学对话、金融研报OCR),省去下载、清洗、格式对齐的2-3周时间。

  2. AI应用市场
    像订阅网易云音乐一样订阅AI能力:

  3. 文生图:Stable Diffusion XL一键出图,支持LoRA微调;
  4. 文生视频:ZeroScope-2 24帧电影级生成;
  5. 智能客服:基于RAG的私有化知识库,30分钟完成领域迁移。
    所有应用已提前封装成GPU云主机镜像,点击“立即体验”即可拉起容器,0代码、0配置、0等待

  6. 开发者中心
    提供“拎包入住”的MLOps流水线:

  7. 代码仓库自动关联Git,commit即触发镜像构建;
  8. 分布式训练框架DeepSpeed、Colossal-AI一键启动;
  9. 实验数据自动写入持久化云存储,跨实例共享,杜绝“今天跑完、明天失踪”。

真实案例:3人团队如何用¥9.9万跑完130亿参数大模型

“原本预算200万买卡,现在9.9万就搞定。”
这是上海某高校NLP实验室的切身经历。团队只有3名硕博生,要做130亿参数的中文法律大模型预训练。
Day 0:注册星宇智算账号,新用户10元体验金到账,顺手拉起2张RTX 4090试跑分词器;
Day 1:通过平台镜像直接调用DeepSpeed-Chat,3小时完成数据并行脚本;
Week 2:训练进入中期,弹性扩容至8卡A100,按小时计费,夜间关机暂停计费;
Week 4:模型收敛,总花费¥7,200,仅为自建方案的1/250
目前该模型已在开源社区斩获1.2k Star,团队论文被ACL 2024接收。“我们把省下来的190万全部投入数据标注,效果肉眼可见。”负责人张博士笑道。


写在最后:让算力像水电一样即开即有

从Gorilla Technology的12.5MW phased数据中心,到国内动辄百亿的智算中心规划,“重资产”似乎仍是官方叙事的主旋律。但在产业一线,越来越多开发者用脚投票,选择把CAPEX转化为OPEX,把固定折旧转化为可变成本。
星宇智算给出的解题思路是:把GPU算力拆成标准商品,把AI应用做成即插即用的软件,让创作者像打开水龙头一样打开智算
当“重”成为过去式,“轻”便是未来式。
现在,点击注册10元体验金已备好,下一款现象级AI应用或许就从你的浏览器标签页开始。