关于 Dola Seed 的一切

字节跳动 AI 模型详解

Dola Seed 是字节跳动 Seed 模型家族在海外的通称——包括 Seedance 视频模型和 Dola-Seed-2.0-Preview 通用多模态模型。目前没有官方全球产品,只有碎片化的访问渠道和令人困惑的第三方选择。我们为您拨开迷雾。

即将推出

AI 视频生成

基于 DolaSeed-2.0-Preview / Seedance 2.0 API

第一时间获取视频生成功能上线通知。

一览

视频模型第1名

竞技场排名

6 个多镜头

最大镜头数

15 秒

最大时长

原生 + 唇形同步

音频

已延迟

全球 API

什么是 Dola Seed?

Dola Seed 是海外社区对字节跳动 Seed 模型家族的通称。它涵盖两条主要产品线:Dola-Seed-2.0-Preview 通用多模态模型(文本 + 视觉),以及 Seedance 视频生成模型。

官方海外模型标识符为 Dola-Seed-2.0-Preview,于 2026 年 2 月在 Arena.ai 上作为通用多模态模型发布。与此同时,视频生成旗舰 Seedance 2.0 在 Artificial Analysis Video Arena 排行榜上位居第一(Elo 1,269),领先于 Kling 3.0、Sora 2 和 Veo 3。

与许多只能生成孤立片段的竞争对手不同,Seedance 专为连贯的多镜头叙事而构建——单个提示即可生成最多 6 个相互关联的镜头,并保持角色一致性、摄影机运动和叙事流畅。它还支持独特的多模态参考系统:您可以附加最多 9 张图片、3 段视频片段和 3 段音频文件,然后在提示中使用 @image1、@video2 等语法引用它们。

核心能力

多镜头叙事

单个提示即可生成最多 6 个相互关联的镜头。AI 保持角色一致性、叙事逻辑和场景间的自然过渡。

@ 参考系统

附加最多 12 个文件(9 张图片、3 段视频、3 段音频)并在提示中直接引用。锁定角色面容、艺术风格或摄影机角度。

原生音频生成

内置音效、环境纹理、背景音乐和 8 种以上语言的唇形同步对话。无需单独的音频处理流程。

导演级摄影机控制

精确指定摄影机运动——平移、倾斜、变焦、推拉、跟踪——并精准执行。

真人视频生成

上传肖像照片即可生成具有逼真面部表情、全身运动和精准唇形同步的视频。2026 年 4 月新增。

灵活的输出格式

4–15 秒片段。多种宽高比:16:9、9:16、4:3、3:4、1:1、21:9 超宽。API 最高 720p;消费级平台可达 2K。

如何访问 Dola Seed 与 Seedance

没有官方全球产品。以下是经验证的访问途径,按可靠性排序。

途径模型适合人群访问难度费用可靠性说明
Jimeng (即梦)2.0Chinese usersEasy (CN phone)Free credits + paidOfficial consumer platform. Requires mainland China phone number.
Doubao2.0Mobile usersMedium (approval)Free (10/day)Often requires Feishu group approval. Fixed 5s/10s duration.
CapCut2.0Brazil, SEA, MX, etc.EasyFree limited-timeRolling out in BR, ID, MY, MX, PH, TH, VN only.
fal.ai2.0DevelopersEasyPay-per-useOfficial partner route. OpenAI-compatible API. No region lock.
BytePlus ModelArk1.5 ProEnterpriseHard$0.10–$0.80/minOfficial enterprise API. 1.5 Pro only. Heavy onboarding.
Dreamina (Global)InternationalN/AN/A UnavailableDoes NOT have Seedance 2.0 yet. Do not subscribe expecting it.
US DirectUS usersN/AN/A UnavailableExcluded from BytePlus rollout. Use fal.ai or wait.

适合...

  • 支持地区的创作者 → CapCut 或即梦
  • 全球开发者 → fal.ai API
  • 企业团队 → BytePlus ModelArk (1.5 Pro)
  • 美国用户 → fal.ai 是目前唯一可靠的选项

Seedance 对比

模型竞技场 Elo原生音频多镜头最大时长全球 API最适合
Seedance 2.01,269 (#1) Yes Yes15s DelayedCharacter dialogue, multi-shot ads
Kling 3.01,248 (#2) No No120s YesLong-form content, fast generation
Sora 2~1,230 3rd party No60s PausedCinematic shorts, complex scenes
Veo 3.1~1,220 Ambient only No8s YesHigh-fidelity textures

来源:Artificial Analysis Video Arena,2026 年 3 月。Elo 评分是动态变化的。

人们用 Seedance 做什么

短剧与叙事

迷你剧试播集、跨场景角色一致的叙事内容。

广告与产品演示

主镜头、产品展示、具有电影级摄影机运动的生活场景。

音乐视频

音画同步、情绪驱动的画面,从抽象到电影级序列。

预可视化

电影制作人的分镜转视频、游戏预告片样片、投资人演示。

为什么 Seedance 2.0 尚未全球可用

2026 年 2 月,Seedance 2.0 发布仅数小时后,包含好莱坞明星(汤姆·克鲁斯、布拉德·皮特)和版权角色(超人、神奇女侠、小丑)的 AI 生成视频迅速走红。美国电影协会(MPA)谴责了该模型,迪士尼、华纳兄弟、派拉蒙天空之舞、奈飞等主要制片厂发出了停止侵权函。

字节跳动原定于 2026 年 2 月 24 日推出全球 API,但为解决这些法律问题而无限期推迟。截至 2026 年 4 月,海外 API 仍处于暂停状态,但该模型在中国和选定的第三方合作伙伴处继续正常运行。

字节跳动此后实施的措施:

  • 禁止将可识别的真人作为素材来源
  • 版权内容过滤
  • 所有输出添加 C2PA 元数据水印
  • 提供 10,000 多个虚拟人物库供批准的商业使用

常见问题