视频生成
多模态模型
12K
| 版本名称: | Seedance 1.5 Pro |
| 所属模型: | 豆包 |
| 所属公司: | 字节跳动 |
| 发布时间: | 2025年12月18日 |
| 最新版本: | 1.5 Pro |
| 参数规模: | 未公开 |
| 上下文长度: | 12K |
| 支持语言: | 中文,英文,日文,韩语,西班牙语 |
| 授权协议: | 商用授权 |
| 体验方式: | https://exp.volcengine.com/ark/vision?launch=seedance |
Seedance 1.5 Pro是字节跳动豆包大模型团队推出的新一代音视频联合生成模型,基于统一的MMDiT架构构建,原生支持音视频同步生成。该模型在2025年12月发布,代表了视频生成技术从单一视觉维度向多模态融合的重要突破。
技术层面,模型采用联合预训练+SFT+RLHF的三阶段训练策略,通过大规模音视频数据集训练,实现了跨模态深度交互。在推理阶段通过多阶段蒸馏框架和量化优化,实现了10倍以上的端到端推理加速。
模型核心创新包括:统一的多模态联合生成架构、全面的音视频数据框架、精细化的后训练优化策略和高效的推理加速方案,为专业级音视频内容创作提供了技术基础。
内容创作:支持短视频、AI短剧、商业广告等内容生成,能够自动完成剧本、表演、配音的全流程制作。
多语言本地化:支持中文、英文、日文、韩语、西班牙语等多种语言,以及16种中文方言的精准配音,适用于跨国企业的本地化营销内容制作。
影视制作辅助:提供电影级运镜控制、希区柯克变焦等专业拍摄手法,可用于影视前期概念设计和分镜制作。
教育培训:支持多语言教学视频生成,能够为不同地区的学生提供方言版本的教学内容。
关注公众号
立刻获取最新消息及人工咨询