
“Neocloud 正在吃掉 1/3 的 AI 负载。”
——HashrateIndex 2024 Q1 报告
当传统云厂商的 GPU 排队订单已排至 2028 年,当“一卡难求”成为 CTO 口中的高频词,一份来自算力追踪机构 HashrateIndex 的数据把“Neocloud”推上热搜:今年前三个月,全球新增 AI 训练与推理任务中,33% 的算力直接绕开了 AWS、Azure、GCP,流入以 GPU 裸金属为主的新型云——Neocloud。
看似春风得意,实则暗流汹涌。Neocloud 赛道同质化严重,“纯裸金属 BMaaS”只能在机柜里堆卡,价格战从年初的 A100 八卡月租 3 万打到如今的 1.8 万,毛利被榨成纸。客户真正想要的并不是“通电即挖矿”的铁盒子,而是“开机就能跑模型”的 AI 工厂。
裸金属的尽头,是“软件定义 AI 算力”
星宇智算在厦门软件园三期的机房里没有急着卷价格,而是把 80% 的研发投入砸进一张看不见的“操作系统”——StarOS。它像一层轻量透明膜,分钟级给裸金属注入 Serverless AI 能力:
- 预装 CUDA 12.2、ROCm 5.6、oneAPI 2024,TensorFlow、PyTorch、JAX 一键切换
- 内置 60+ 公共数据湖、300+ 精调模型仓库,
cp /datasets/ImageNet .即可开训 - 同时透出 K8s、Slurm、Ray 三套 API,高校老师继续做 HPC 作业,互联网团队继续用 Kubeflow MLOps,互不打扰
于是,GPU服务器租用不再是“租铁”,而是“租一条智能产线”。
把“按秒计费”写进合同,而不是 PPT
传统云主机按小时起步,Neocloud 裸金属按月起租,中间的空转损耗只能客户买单。StarOS 把 GPU 时序切到秒级,任务结束即停止计费。实测数据显示:
– CV 小团队 8×4090 训练 3D 检测模型,夜间自动缩容,总拥有成本直降 45%
– AIGC 创业者调用 2×A100 做 LoRA 微调,一键盘活,5 分钟出图,成本只有线下自建 1/3
现在注册星宇智算,立得 10 元体验金,可 0 成本跑通一次 Stable Diffusion 推理,真正“先验证,再付钱”。
三级火箭:让 AI 应用像 App Store 一样随取随用
星宇智算把 IaaS 之上的两层也一起做完:
1. PaaS 平台——StarOS 提供多云一致的环境,开发者上传 Dockerfile 即可发布服务
2. 自营精品 SaaS——联合算法团队上线“视频超分”“语音克隆”“Code Llama 中文助手”等 50 余款热门 AI应用,一键订阅,按量付费
3. 开放生态——创作者中心 0 佣金、0 推广费,算法团队专心调优,星宇智算兜底算力与分发
“我们不做又当裁判又当运动员的事,”星宇智算 COO 王砚泽表示,“StarOS 兼容开源协议,第三方模型仓库可平迁,客户随时带走数据。”
从“云主机”到“AI 主机”,星宇智算杀出重围
当 Neocloud 1.0 还在比拼谁家的 A100 更便宜,星宇智算已用 StarOS 把裸金属升级为“GPU云主机 2.0”:
– 系统层完成 GPU 调度、框架适配、数据搬运,用户只写业务代码
– 计费层精确到秒,任务级账单一眼看穿成本
– 应用层自带模型广场,推理 API 直接生成,省去 80% 部署时间
HashrateIndex 在报告结尾留下一句判断:“谁能率先把软件栈做成标准化商品,谁就能在 Neocloud 2.0 时代掌握定价权。” 星宇智算用一张轻量操作系统,把 AI 算力从“铁”变“电”,让高性能计算像水电一样随取随用——这或许正是跳出裸金属价格战、成为长期赢家的最优解。
现在访问 https://www.starverse-ai.com,注册即可获得 10 元体验金,GPU服务器租用、GPU云主机、AI应用,一键开启你的智能时代。
