星桥API - 大模型接口服务 - 星宇智算

模型名称	特性	价格（星元）	简介
qwen3.7-max	流式输出深度思考工具调用结构化输出	输入价格: 6000.00 / M tokens 创建缓存价格: 7500.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 1800.00 / M tokens	Qwen3.7系列中规模最大、综合能力最强的Max模型，当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型，核心优势在于智能体能力的广度与深度：在编程、办公与生产力、长周期自
qwen3.7-plus	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 1600.00 / M tokens 创建缓存价格: 2000.00 / M tokens 命中缓存价格: 320.00 / M tokens 输出价格: 6400.00 / M tokens	Qwen3.7系列中高性价比Plus模型，在强大文本能力的基础上全面升级了视觉-语言能力，同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力，能够感知真
qwen3.6-plus	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 2000.00 / M tokens 创建缓存价格: 2500.00 / M tokens 命中缓存价格: 200.00 / M tokens 输出价格: 12000.00 / M tokens	Qwen3.6原生视觉语言系列Plus模型，展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果相较3.5系列显著提升。
qwen3.6-flash	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 1200.00 / M tokens 创建缓存价格: 1500.00 / M tokens 命中缓存价格: 120.00 / M tokens 输出价格: 7200.00 / M tokens	Qwen3.6原生视觉语言系列Flash模型，模型效果相较3.5-Flash显著提升。本模型重点提升agentic coding能力（在多项代码智能体基准上大幅超越前代）、数学推理和代码推理能力；视觉
qwen3.5-plus	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 800.00 / M tokens 创建缓存价格: 1000.00 / M tokens 命中缓存价格: 80.00 / M tokens 输出价格: 4800.00 / M tokens	Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。
qwen3.5-flash	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 200.00 / M tokens 创建缓存价格: 250.00 / M tokens 命中缓存价格: 20.00 / M tokens 输出价格: 2000.00 / M tokens	Qwen3.5原生视觉语言系列Flash模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。
glm-5.1	流式输出深度思考工具调用结构化输出	输入价格: 6000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1300.00 / M tokens 输出价格: 24000.00 / M tokens	GLM-5.1 是智谱最新旗舰模型，代码能力大大增强，长程任务显著提升，能够在单次任务中持续、自主地工作长达 8 小时，完成从规划、执行到迭代优化的完整闭环，交付工程级成果。
glm-5	流式输出深度思考工具调用结构化输出	输入价格: 4000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1000.00 / M tokens 输出价格: 18000.00 / M tokens	GLM-5 是智谱的基座模型，面向 Agentic Engineering 打造，能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。
glm-5-turbo	流式输出深度思考工具调用结构化输出	输入价格: 5000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 22000.00 / M tokens	GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。其从训练阶段就针对龙虾任务的核心需求进行专项优化，增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力，使其
glm-5v-turbo	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 5000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 22000.00 / M tokens	GLM-5V-Turbo 是智谱首个多模态 Coding 基座模型，面向视觉编程任务打造。能够原生处理图片、视频、文本等多模态输入，同时擅长长程规划、复杂编程和动作执行。
glm-4.6v	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 1000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 200.00 / M tokens 输出价格: 3000.00 / M tokens	GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代，它将训练时上下文窗口提升到128k tokens，在视觉理解精度上达到同参数规模 SOTA。
glm-4.6v-flashx	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 150.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 30.00 / M tokens 输出价格: 1500.00 / M tokens	GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代，它将训练时上下文窗口提升到128k tokens，在视觉理解精度上达到同参数规模 SOTA。
doubao-seed-2.0-pro	流式输出图像理解视频理解深度思考工具调用	输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens	侧重长链路推理能力与复杂任务稳定性，适配真实业务中的复杂场景
doubao-seed-2.0-lite	流式输出图像理解视频理解音频处理深度思考工具调用	输入价格: 600.00 / M tokens 命中缓存价格: 120.00 / M tokens 输出价格: 3600.00 / M tokens	豆包大模型家族首款全模态理解模型，支持视频、图像、音频、文本原生统一理解，同时升级Agent、Coding与GUI能力
doubao-seed-2.0-mini	流式输出图像理解视频理解音频处理深度思考工具调用	输入价格: 200.00 / M tokens 命中缓存价格: 40.00 / M tokens 输出价格: 2000.00 / M tokens	豆包大模型家族全模态理解模型，更短的思考长度，更高的tokens效率
doubao-seed-2.0-code	流式输出图像理解视频理解深度思考工具调用	输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens	Seed 2.0 的编程加强版，更适合 Agentic Coding
MiniMax-M3	流式输出图像理解视频理解深度思考工具调用	输入价格: 2100.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 8400.00 / M tokens	MiniMax M3 凭借业界领先的 Coding 与 Agentic 能力、1M 超长上下文窗口以及原生多模态特性，可出色胜任企业级长文档理解、高质量内容生成、代码编写、Bug 修复及原生应用构建等
MiniMax-M2.7	流式输出深度思考工具调用	输入价格: 2100.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 8400.00 / M tokens	M2.7 能够自行构建复杂 Agent Harness，并基于 Agent Teams、复杂 Skills、Tool Search tool 等能力，完成高度复杂的生产力任务。
MiniMax-M2.7-highspeed	流式输出深度思考工具调用	输入价格: 4200.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 16800.00 / M tokens	与 M2.7 效果不变，速度大幅提升
MiniMax-M2.5	流式输出深度思考工具调用	输入价格: 2100.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 210.00 / M tokens 输出价格: 8400.00 / M tokens	智能体世界的SOTA，专为智能体2.0设计，将编码扩展到现实世界包括工作空间、娱乐和个人助理。
MiniMax-M2.5-highspeed	流式输出深度思考工具调用	输入价格: 4200.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 210.00 / M tokens 输出价格: 16800.00 / M tokens	与 M2.5 效果不变，速度大幅提升
kimi-k2.7-code	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 6500.00 / M tokens 命中缓存价格: 1300.00 / M tokens 输出价格: 27000.00 / M tokens	Kimi K2.7 Code 是 Kimi 迄今最智能的 Coding 模型，在长上下文中更可靠地遵循指令，能以更高的成功率完成编程任务，同时支持文本、图片与视频输入，思考模式。
kimi-k2.6	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 6500.00 / M tokens 命中缓存价格: 1100.00 / M tokens 输出价格: 27000.00 / M tokens	Kimi K2.6 是 Kimi 最新最智能的模型，Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升。
kimi-k2.5	流式输出图像理解视频理解深度思考工具调用结构化输出	输入价格: 4000.00 / M tokens 命中缓存价格: 700.00 / M tokens 输出价格: 21000.00 / M tokens	Kimi K2.5 是 Kimi 在2026年最新推出的智能模型，在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。
deepseek-v4-pro	流式输出深度思考工具调用结构化输出	输入价格: 3000.00 / M tokens 命中缓存价格: 25.00 / M tokens 输出价格: 6000.00 / M tokens	DeepSeek-V4-Pro 1.6T 参数的原生多模态旗舰，通过全新的 CSA+HCA 混合注意力架构，在复杂数学推理、长程代码工程及深度智能体协作领域代表了当前的行业顶尖水平。
deepseek-v4-flash	流式输出深度思考工具调用结构化输出	输入价格: 1000.00 / M tokens 命中缓存价格: 20.00 / M tokens 输出价格: 2000.00 / M tokens	DeepSeek-V4-Flash 专为高并发与低延迟设计的生产级利器，以 1M 上下文为全系标配，在极低成本下实现了媲美旗舰的推理表现与卓越的 Agent 响应效率。
hy3-preview	流式输出深度思考工具调用结构化输出	输入价格: 1200.00 / M tokens 命中缓存价格: 400.00 / M tokens 输出价格: 4000.00 / M tokens	混元 Hy3 preview 面向 Agent 工作负载设计，采用 295B/21B 激活的 MoE 架构。
ernie-5.1	流式输出深度思考工具调用	输入价格: 4000.00 / M tokens 输出价格: 18000.00 / M tokens	ERNIE 5.1是文心系列最新模型，基础能力全面升级，在智能体、知识、推理、深度搜索等方面均有显著提升。
ernie-5.0	流式输出图像理解视频理解深度思考工具调用	输入价格: 6000.00 / M tokens 输出价格: 24000.00 / M tokens	文心新一代模型文心5.0是原生全模态大模型，采用原生的全模态统一建模技术，将文本、图像、音频、视频联合建模，具备综合的全模态能力。