腾讯混元文生图开源模型推出小显存版本,仅需6G显存即可运行
创始人
2024-07-05 10:42:17
0

2024-07-05 10:04:08作者:姚立伟

7月4日,腾讯混元文生图大模型(混元DiT)宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者十分友好,该版本与LoRA、ControlNet等插件,都已适配至Diffusers库;并新增对Kohya图形化界面的支持,让开发者可以低门槛地训练个性化LoRA模型;同时,混元DiT模型升级至1.2版本,在图片质感与构图方面均有所提升。

模型易用性再提升,个人电脑可轻松运行

基于DiT架构的文生图模型生成图片质感更佳,但对显存的要求却非常高,让许多开发者望而却步。这也是新版本Stable Diffusion模型无法快速普及的原因之一。

应广大开发者的需求,混元DiT推出小显存版本,最低仅需6G显存即可运行优化推理框架,对使用个人电脑本地部署的开发者非常友好。经过与Hugging Face合作,小显存版本、LoRA与ControlNet插件,都已经适配到Diffusers库中。开发者无需下载原始代码,仅用简单的三行代码仅可调用,大大简化了使用成本。

同时,混元DiT宣布接入Kohya,让开发者可以低门槛地训练专属LoRA模型。

Kohya是一个开源的、轻量化模型微调训练服务,提供了图形化的用户界面,被广泛用于扩散模型类文生图模型的训练。用户可以通过图形化界面,完成模型的全参精调及LoRA训练,无需涉及到代码层面的细节。训练好的模型符合Kohya生态架构,可以低成本与 WebUI 等推理界面结合,实现一整套“训练-生图”工作流。

此外,腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。

相比起业界的开源打标模型,混元Captioner模型能更好的理解与表达中文语义,输出的图片描述更为结构化、完整和准确,并能精准识别出常见知名人物与地标。模型还支持开发者自行补充和导入个性化的背景知识。

混元Captioner模型开源之后,全球的文生图研究者、数据标注人员,均可使用混元Captioner高效地提升自身图像描述质量,生成更全面、更准确的图片描述,提升模型效果。混元Captioner生成的数据集不仅能用于训练基于混元DiT的模型,亦可用于其他视觉模型训练。

众多开发者关注,成最受欢迎国产DiT开源模型

在提升模型易用性的同时,腾讯宣布混元文生图打标模型”混元Captioner“正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作高质量的文生图数据集。

相比起业界的开源打标模型,混元Captioner模型能更好的理解与表达中文语义,输出的图片描述更为结构化、完整和准确,并能精准识别出常见知名人物与地标。模型还支持开发者自行补充和导入个性化的背景知识。

作为首个中文原生DiT开源模型,混元DiT自全面开源以来,一直持续建设生态。6月,混元DiT发布的专属加速库,可将推理效率进一步提升,生图时间缩短75%;并进一步开源了推理代码;发布LoRA和ControlNet等插件。于此同时,模型易用性大幅提升,用户可以通过Hugging Face Diffusers快讯调用混元DiT模型及其插件,或基于Kohya和ComfyUI等图形化界面训练与使用混元DiT。

目前,在众多开发者的支持下,混元DiT发布不到2个月,Github Star数已经超过2.6k,成为最受欢迎的国产DiT开源模型。

相关内容

热门资讯

透视科技!aapoker透视脚... 透视科技!aapoker透视脚本,aapoker辅助器是真的吗,黑科技教程(有挂教程);1、aapo...
透视工具!aapoker ai... 透视工具!aapoker ai插件,aapoker免费透视脚本,安装教程(有挂脚本)1、aapoke...
透视ai!aapoker怎么提... 透视ai!aapoker怎么提高中牌率,aapoker发牌逻辑,科技教程(有挂辅助);aapoker...
透视免费!aapoker辅助器... 透视免费!aapoker辅助器是真的吗,aapoker插件下载,可靠技巧(有挂教程)1、许多玩家不知...
透视脚本!aapoker脚本,... 透视脚本!aapoker脚本,aapoker透视插件,靠谱教程(有挂工具);1、下载好aapoker...
移动手机卡套餐套路多?2025... 办卡关注公众号:找卡星球 这里将是您揭秘流量卡真相、探索优质正规流量卡办理的一站式平台。让我们一起,...
原创 荷... 据澎湃新闻报道,10月21日这天,国际经贸领域的目光都聚焦在两场特殊的对话上——中国商务部长王文涛先...
沈阳自动化所提出面向存储加密超... 日前,中国科学院沈阳自动化研究所与香港城市大学科研团队开展合作,通过开发动态光化学能量转换超材料,提...
百亿级人类基因组基础模型发布 本报电(华轩)近日,在第二十届国际基因组学大会上,华大生命科学研究院与之江实验室联合发布了百亿参数人...
最后一个没有广告的地图,要消失... 彭博社的 Mark Gurman 爆料称,苹果正计划最早明年,在地图 app 里引入广告。 形式可能...