首个中文原生DiT架构 腾讯混元文生图大模型宣布全面开源
创始人
2024-05-14 18:53:04
0

原标题:首个中文原生DiT架构 腾讯混元文生图大模型宣布全面开源

快科技今日(5月14日)消息,今日,腾讯旗下混元文生图大模型(混元DiT,Diffusion Models with Transformers)宣布全面开源。

目前已在Hugging Face、Github上发布,包含模型权重、推理代码、模型算法等完整模型,供企业与个人开发者免费商用。

据媒体报道,腾讯混元文生图负责人卢清林表示,混元DiT开源的价值有两方面。

一方面这是业内首个中文原生DiT架构,弥补了开源社区的空白,另一方面混元DiT为全面开放,与现网版本完全一致。

据介绍,此次开源的混元DiT采用了与Sora同样的背后关键技术——DiT架构,还支持256字中文理解,不仅支持文生图,也可作为视频等多模态视觉生成的基础。

腾讯方面表示,为了构建混元DiT设计了Transformer结构、文本编码器和位置编码,构建了完整的数据管道,用于更新和评估数据,为模型优化迭代提供帮助。

为了实现细粒度的文本理解,还训练了多模态大语言模型来优化图像的文本描述。

最终,混元DiT能够与用户进行多轮对话,根据上下文生成并完善图像。

相关内容

热门资讯

校企携手光影筑梦 贵州学子用影... 近日,一部名为《爱你老几》的校园温情微电影在各大短视频平台温情上线。这部影片由贵州师范大学传媒学院携...
你对AI说“谢谢”吗?联合国大... 联合国大学水、环境与健康研究所(UNU-INWEH)近日发布的一份报告显示,精简提示中的礼貌用语,可...
精正照明取得霓虹灯带专利,提升... 国家知识产权局信息显示,深圳市精正照明科技有限公司取得一项名为“一种霓虹灯带”的专利,授权公告号CN...
鲁弘建设取得成球机专利,有效达... 国家知识产权局信息显示,山东鲁弘建设工程有限公司取得一项名为“成球机”的专利,授权公告号CN2243...
孩子不爱吃饭愁家长,为何这8道... 孩子不爱吃饭,可愁坏了不少家长。其实,只要饭菜对了口味,孩子自然会胃口大开。今天就给大家分享8道让孩...
和讯陆润凯:美股调整,下周如何... 美股大跌,我们讲下下周大a的走势能不能扛住,就看下周一这一波了。和讯陆润凯分析,首先说一下为什么调,...
穿越周期变局 台达以硬核智造构... 上海2026年6月6日-- 据亚洲控制工程网报道。 当光伏产业站在产能出清与技术革命的交汇路口,产业...
魏奉思院士:打造卫星大脑领跑智... IT时代网6月6日消息,在近日深圳创新发展研究院院士报告厅活动中,中国科学院院士、哈尔滨工业大学(深...
原创 宇... 最近宇树上市刷屏,但看懂的人都知道:这家曾经的国产机器人之光,已经走进无解死局。不管这次上市最终成不...