| 模型名称 | 厂商 | 特性 | 价格(星元) | 简介 |
|---|---|---|---|---|
| qwen3.7-max | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 6000.00 / M tokens 创建缓存价格: 7500.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 1800.00 / M tokens | Qwen3.7系列中规模最大、综合能力最强的Max模型,当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型,核心优势在于智能体能力的广度与深度:在编程、办公与生产力、长周期自 |
| qwen3.7-plus | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 1600.00 / M tokens 创建缓存价格: 2000.00 / M tokens 命中缓存价格: 320.00 / M tokens 输出价格: 6400.00 / M tokens | Qwen3.7系列中高性价比Plus模型,在强大文本能力的基础上全面升级了视觉-语言能力,同时保持了在编码、工具使用和生产力工作流方面的完整智能体能力。其核心特色为多模态交互混合智能体能力,能够感知真 |
| qwen3.6-plus | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 2000.00 / M tokens 创建缓存价格: 2500.00 / M tokens 命中缓存价格: 200.00 / M tokens 输出价格: 12000.00 / M tokens | Qwen3.6原生视觉语言系列Plus模型,展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果相较3.5系列显著提升。 |
| qwen3.6-flash | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 1200.00 / M tokens 创建缓存价格: 1500.00 / M tokens 命中缓存价格: 120.00 / M tokens 输出价格: 7200.00 / M tokens | Qwen3.6原生视觉语言系列Flash模型,模型效果相较3.5-Flash显著提升。本模型重点提升agentic coding能力(在多项代码智能体基准上大幅超越前代)、数学推理和代码推理能力;视觉 |
| qwen3.5-plus | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 800.00 / M tokens 创建缓存价格: 1000.00 / M tokens 命中缓存价格: 80.00 / M tokens 输出价格: 4800.00 / M tokens | Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。 |
| qwen3.5-flash | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 200.00 / M tokens 创建缓存价格: 250.00 / M tokens 命中缓存价格: 20.00 / M tokens 输出价格: 2000.00 / M tokens | Qwen3.5原生视觉语言系列Flash模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。 |
| glm-5.1 | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 6000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1300.00 / M tokens 输出价格: 24000.00 / M tokens | GLM-5.1 是智谱最新旗舰模型,代码能力大大增强,长程任务显著提升,能够在单次任务中持续、自主地工作长达 8 小时,完成从规划、执行到迭代优化的完整闭环,交付工程级成果。 |
| glm-5 | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 4000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1000.00 / M tokens 输出价格: 18000.00 / M tokens | GLM-5 是智谱的基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。 |
| glm-5-turbo | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 5000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 22000.00 / M tokens | GLM-5-Turbo 是面向 OpenClaw 龙虾场景深度优化的基座模型。 其从训练阶段就针对龙虾任务的核心需求进行专项优化,增强如工具调用、指令遵循、定时与持续性任务、长链路执行等核心能力,使其 |
| glm-5v-turbo | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 5000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 1200.00 / M tokens 输出价格: 22000.00 / M tokens | GLM-5V-Turbo 是智谱首个多模态 Coding 基座模型,面向视觉编程任务打造。能够原生处理图片、视频、文本等多模态输入,同时擅长长程规划、复杂编程和动作执行。 |
| glm-4.6v | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 1000.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 200.00 / M tokens 输出价格: 3000.00 / M tokens | GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA。 |
| glm-4.6v-flashx | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 150.00 / M tokens 创建缓存价格: 0.00 / M tokens 命中缓存价格: 30.00 / M tokens 输出价格: 1500.00 / M tokens | GLM-4.6V 系列是 GLM 系列在多模态方向上的一次重要迭代,它将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模 SOTA。 |
| doubao-seed-2.0-pro | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens | 侧重长链路推理能力与复杂任务稳定性,适配真实业务中的复杂场景 |
| doubao-seed-2.0-lite | ![]() | 流式输出图像理解视频理解音频处理深度思考工具调用 | 输入价格: 600.00 / M tokens 命中缓存价格: 120.00 / M tokens 输出价格: 3600.00 / M tokens | 豆包大模型家族首款全模态理解模型,支持视频、图像、音频、文本原生统一理解,同时升级Agent、Coding与GUI能力 |
| doubao-seed-2.0-mini | ![]() | 流式输出图像理解视频理解音频处理深度思考工具调用 | 输入价格: 200.00 / M tokens 命中缓存价格: 40.00 / M tokens 输出价格: 2000.00 / M tokens | 豆包大模型家族全模态理解模型,更短的思考长度,更高的tokens效率 |
| doubao-seed-2.0-code | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens | Seed 2.0 的编程加强版,更适合 Agentic Coding |
| MiniMax-M3 | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 2100.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 8400.00 / M tokens | MiniMax M3 凭借业界领先的 Coding 与 Agentic 能力、1M 超长上下文窗口以及原生多模态特性,可出色胜任企业级长文档理解、高质量内容生成、代码编写、Bug 修复及原生应用构建等 |
| MiniMax-M2.7 | ![]() | 流式输出深度思考工具调用 | 输入价格: 2100.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 8400.00 / M tokens | M2.7 能够自行构建复杂 Agent Harness,并基于 Agent Teams、复杂 Skills、Tool Search tool 等能力,完成高度复杂的生产力任务。 |
| MiniMax-M2.7-highspeed | ![]() | 流式输出深度思考工具调用 | 输入价格: 4200.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 420.00 / M tokens 输出价格: 16800.00 / M tokens | 与 M2.7 效果不变,速度大幅提升 |
| MiniMax-M2.5 | ![]() | 流式输出深度思考工具调用 | 输入价格: 2100.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 210.00 / M tokens 输出价格: 8400.00 / M tokens | 智能体世界的SOTA,专为智能体2.0设计,将编码扩展到现实世界包括工作空间、娱乐和个人助理。 |
| MiniMax-M2.5-highspeed | ![]() | 流式输出深度思考工具调用 | 输入价格: 4200.00 / M tokens 创建缓存价格: 2625.00 / M tokens 命中缓存价格: 210.00 / M tokens 输出价格: 16800.00 / M tokens | 与 M2.5 效果不变,速度大幅提升 |
| kimi-k2.7-code | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 6500.00 / M tokens 命中缓存价格: 1300.00 / M tokens 输出价格: 27000.00 / M tokens | Kimi K2.7 Code 是 Kimi 迄今最智能的 Coding 模型,在长上下文中更可靠地遵循指令,能以更高的成功率完成编程任务,同时支持文本、图片与视频输入,思考模式。 |
| kimi-k2.6 | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 6500.00 / M tokens 命中缓存价格: 1100.00 / M tokens 输出价格: 27000.00 / M tokens | Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升。 |
| kimi-k2.5 | ![]() | 流式输出图像理解视频理解深度思考工具调用结构化输出 | 输入价格: 4000.00 / M tokens 命中缓存价格: 700.00 / M tokens 输出价格: 21000.00 / M tokens | Kimi K2.5 是 Kimi 在2026年最新推出的智能模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。 |
| deepseek-v4-pro | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 3000.00 / M tokens 命中缓存价格: 25.00 / M tokens 输出价格: 6000.00 / M tokens | DeepSeek-V4-Pro 1.6T 参数的原生多模态旗舰,通过全新的 CSA+HCA 混合注意力架构,在复杂数学推理、长程代码工程及深度智能体协作领域代表了当前的行业顶尖水平。 |
| deepseek-v4-flash | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 1000.00 / M tokens 命中缓存价格: 20.00 / M tokens 输出价格: 2000.00 / M tokens | DeepSeek-V4-Flash 专为高并发与低延迟设计的生产级利器,以 1M 上下文为全系标配,在极低成本下实现了媲美旗舰的推理表现与卓越的 Agent 响应效率。 |
| hy3-preview | ![]() | 流式输出深度思考工具调用结构化输出 | 输入价格: 1200.00 / M tokens 命中缓存价格: 400.00 / M tokens 输出价格: 4000.00 / M tokens | 混元 Hy3 preview 面向 Agent 工作负载设计,采用 295B/21B 激活的 MoE 架构。 |
| ernie-5.1 | ![]() | 流式输出深度思考工具调用 | 输入价格: 4000.00 / M tokens 输出价格: 18000.00 / M tokens | ERNIE 5.1是文心系列最新模型,基础能力全面升级,在智能体、知识、推理、深度搜索等方面均有显著提升。 |
| ernie-5.0 | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 6000.00 / M tokens 输出价格: 24000.00 / M tokens | 文心新一代模型文心5.0是原生全模态大模型,采用原生的全模态统一建模技术,将文本、图像、音频、视频联合建模,具备综合的全模态能力。 |










