字节跳动发布Seedance 1.5 pro模型,支持音视频联合生成
创始人
2025-12-17 00:02:35
0

凤凰网科技讯 12月16日,字节跳动发布新一代音视频生成模型Seedance 1.5 pro。该模型支持从文本或图像生成带有同步音频的视频,实现了音视频的联合生成。

据介绍,Seedance 1.5 pro在音画同步方面进行了优化,旨在提升生成内容中口型、语调与表演节奏的一致性。模型支持包括中文、英文、日文在内的多语种,并可模拟四川话、粤语等方言的语音特征。在视频层面,该模型声称具备一定的自主运镜调度能力,可生成如长镜头跟随、希区柯克式变焦等效果,以增强画面的动态张力与叙事感。

技术层面,该模型采用了基于MMDiT架构的音视频联合生成框架,并通过多阶段数据链路与强化学习方式进行优化。团队表示,其已在影视创作、广告制作、短剧及游戏内容等场景中进行测试,生成内容在指令遵循、音质表现等方面有所提升,但在复杂运动的物理稳定性、多角色对话等方面仍有改进空间。

相关内容

热门资讯

机器人、光模块、芯片,AI企业... 12月17日,广州举办“十四五”建设现代产业体系新闻发布会。会上数据显示,在推动“数转”“智改”“网...
消息称苹果iPhone 17e... IT之家 12 月 17 日消息,科技媒体 The Information 昨日(12 月 16 日...
合肥蜀山区如何让“寸土”生“寸... 近日,安徽省亩均效益评价联席会议办公室正式公布2025年安徽省制造业企业、县(市、区)、开发区亩均效...
上蔡供电公司:深化地址数据治理... 大象新闻记者 周文德 通讯员 于亚洲 唐培森 为全面提升数据质量,支撑电网精准管理,12月15日,...
盐城射阳60亿元新材料项目加速... 仲冬时节,寒意虽浓,却难掩企业火热的发展势头。近日,在射阳港经济开发区,江苏京奕绿能新材料科技有限公...
原创 A... 文/杨剑勇 沐曦股份以700的元开盘,相较于发行价(104.66元)上涨568%,上午最高涨幅更是达...
收购扫地机器人鼻祖,深圳如何“... 文|无相财经 12月15日,美国扫地机器人行业开创者iRobot宣布进入破产程序,解救它的重组企业...