| 模型名称 | 厂商 | 特性 | 价格(星元) | 简介 |
|---|---|---|---|---|
| doubao-seed-2.0-pro | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens | 侧重长链路推理能力与复杂任务稳定性,适配真实业务中的复杂场景 |
| doubao-seed-2.0-lite | ![]() | 流式输出图像理解视频理解音频处理深度思考工具调用 | 输入价格: 600.00 / M tokens 命中缓存价格: 120.00 / M tokens 输出价格: 3600.00 / M tokens | 豆包大模型家族首款全模态理解模型,支持视频、图像、音频、文本原生统一理解,同时升级Agent、Coding与GUI能力 |
| doubao-seed-2.0-mini | ![]() | 流式输出图像理解视频理解音频处理深度思考工具调用 | 输入价格: 200.00 / M tokens 命中缓存价格: 40.00 / M tokens 输出价格: 2000.00 / M tokens | 豆包大模型家族全模态理解模型,更短的思考长度,更高的tokens效率 |
| doubao-seed-2.0-code | ![]() | 流式输出图像理解视频理解深度思考工具调用 | 输入价格: 3200.00 / M tokens 命中缓存价格: 640.00 / M tokens 输出价格: 16000.00 / M tokens | Seed 2.0 的编程加强版,更适合 Agentic Coding |
| doubao-seed-character | ![]() | 流式输出工具调用 | 输入价格: 800.00 / M tokens 命中缓存价格: 160.00 / M tokens 输出价格: 2000.00 / M tokens | 长旁白更细腻|剧情推进更稳定|角色对话更自然 |
| doubao-embedding-vision | ![]() | 多模态向量 | 输入价格: 700.00 / M tokens | 全新Seed1.6-Embedding-1215,相较于上一代0615版本,新版本实现了多项核心能力升级 |
| doubao-seedream-5.0-lite | ![]() | 文生图图生图图像编辑多参考图 | 生成图片: 220 / 张 | 字节跳动发布的最新图像创作模型。该模型首次搭载联网检索功能,能融合实时网络信息,提升生图时效性。同时,模型的聪明度进一步升级,能够精准解析复杂指令和视觉内容。 |
| doubao-seedream-4.5 | ![]() | 文生图图生图图像编辑多参考图 | 生成图片: 250 / 张 | Seedream 4.5 整合了文生图、图生图、组图输出等能力,融合常识和推理能力。 |
| doubao-seedream-4.0 | ![]() | 文生图图生图图像编辑多参考图 | 生成图片: 200 / 张 | Seedream 4.0 是基于领先架构的SOTA级多模态图像创作模型,其生成美感、指令遵循、结构完整度、主体保持一致性处于世界头部水平。 |
| doubao-seedance-2.0 | ![]() | 文生视频图生视频首帧生视频首尾帧生视频参考生视频视频编辑 | 无参考视频,生成480P: 500 / 秒 无参考视频,生成720P: 1000 / 秒 无参考视频,生成1080P: 2500 / 秒 有参考视频,生成480P: 300 / 秒 有参考视频,生成720P: 600 / 秒 有参考视频,生成1080P: 1500 / 秒 | 支持图像、视频、音频等多模态作为参考输入生成视频,还具备视频编辑、延长等能力,能高精度还原各类细节并稳定角色特征,具备极致拟真的视听稳定性,深度适配商业广告、影视制作与社交媒体营销等各大核心场景。 |
| doubao-seedance-2.0-fast | ![]() | 文生视频图生视频首帧生视频首尾帧生视频参考生视频视频编辑 | 无参考视频,生成480P: 370 / 秒 无参考视频,生成720P: 800 / 秒 有参考视频,生成480P: 220 / 秒 有参考视频,生成720P: 480 / 秒 | Seedance 2.0 fast是豆包大模型团队推出的新一代多模态视频创作模型,它继承了Seedance 2.0模型的核心功能和优势,生成速度更快。 |
| doubao-seedance-1.5-pro | ![]() | 文生视频图生视频首帧生视频首尾帧生视频参考生视频视频编辑 | 生成480P无声视频: 80 / 秒 生成720P无声视频: 180 / 秒 生成1080P无声视频: 390 / 秒 生成480P有声视频: 160 / 秒 生成720P有声视频: 350 / 秒 生成1080P有声视频: 780 / 秒 | 可生成音画高精同步的视频内容。支持多人多语言对白,全面覆盖环境音、动作音、合成音、乐器音、背景音及人声,支持首尾帧,实现影视级叙事效果,满足影视、漫剧、电商及广告领域的高阶创作需求 |



