蚂蚁集宣布正式开源统一多模态大模型Ming-lite-omni
创始人
2025-05-30 19:00:54
0

5月27日,在蚂蚁技术日上,蚂蚁集团旗下的百灵大模型(Ling)团队宣布正式开源统一多模态大模型Ming-lite-omni。据蚂蚁方面介绍,这是一款基于Ling-lite构建的MoE架构的全模态模型,其总参数22B,激活参数3B。

据悉,Ming-lite-omni当前模型权重和推理代码已开源,后续会陆续开源训练代码和训练数据。

https://huggingface.co/inclusionAI/Ming-Lite-Omni

今年以来,百灵大模型已经连续开源了多个模型产品,包括2个MoE架构的大语言模型,Ling-lite和Ling-plus,多模态大模型Ming-lite-uni,以及Ming-lite-omni-preview。

其中,其中五月中旬开源了Ling-lite-1.5,据百灵方面介绍,“能力已经接近同水位SOTA水平,介于千问4B和8B的水平。”蚂蚁方面称,这两个模型在多个算力平台(包括非Hopper架构的国产算力)进行训练,验证了300B尺寸的SOTA MoE大语言模型在非高端算力平台上训练的可行性。

而本次开源的Ming-lite-omni产品在多项理解和生成能力评测中,性能与10B量级领先的多模态大模型相当或更优。蚂蚁方面认为,这是目前已知首个在模态支持方面能够与GPT-4o相媲美的开源模型。

百灵大模型负责人西亭对媒体表示,百灵大模型的命名规则是Ling代表基础大模型,Ring代表推理版本,Ming代表多模态大模型。百灵在过去主要在几个方面做了聚焦,一个是很早做MoE架构的探索,坚定的在语言大模型和多模态大模型上面统一使用了MoE的架构,同时使用了大量非高端的算力平台,证明了国产GPU的“也能训练出来可比拟GPT4o的模型”。其次,百灵很重视多模态领域的探索,一直在推进多模态的生成和理解的统一,而本次开源的Ming-lite-omin即是过去技术探索的成果。

百灵方面表示,团队下一步将持续优化Ming-lite-omni在全模态理解和生成任务上的效果,并提升Ming-lite-omni的多模复杂推理能力;同时也会训练更大尺寸的全模态模型Ming-plus-omni。此外,根据西亭透露, 百灵还在筹备Ling的Max版本,发布节点将会是“追寻跟(deepseek)V3的版本差不多的版本时开出去”。

(雷峰网)

相关内容

热门资讯

科技巨头争夺未来:智能手机时代... 【环球网科技综合报道】在科技飞速发展的今天,智能手机这一定义了过去十多年数字时代的设备或许即将成为历...
新华访谈|天问二号有哪些了不起... 5月29日凌晨1时31分,中国在西昌卫星发射中心用长征三号乙运载火箭,成功将行星探测工程天问二号探测...
石化油服获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示石化油服(600871)新获得一项发明专利授权,专利名为“一种...
雷军宣布小米·中国汽车耐力锦标... 5月31日,雷军发文宣布小米·中国汽车耐力锦标赛成都站,今天正式开赛,大家一睹中国最高级别的汽车耐力...
知名演员去世,祖籍山东 5月30日深夜,知名纪录片导演郭柯在个人社交账号发文,透露凭借《银狐》《戏王之王》《胜者为王3》等作...
原创 法... 5月27日,法国军方终于被问到了一个非常尴尬的问题,在5月7日印巴空战当中,到底有没有阵风战机被击落...
重庆部分居民称自来水有臭味,洗... 极目新闻记者 王灿 “家里的自来水有好大一股味道啊”“洗碗洗杯子不得不用矿泉水来冲”,5月30日,许...
A股:大家要做好心理准备,端午... A股市场,向来是投资者们情绪的“过山车”。今天,A股又想重演V形反转的走势,可最终连早盘的跳空缺口都...
二〇二五年科学教育天山行活动启... 29日,2025年全国科技活动周和全国科技工作者日新疆主场活动暨科学教育天山行活动举行启动仪式。科技...
美国男子指导女儿开车,女儿误踩... 近日,美国洛杉矶一名15岁少女练车时发生意外,导致指导她学车的父亲当场身亡,她自己也受了伤。 警方称...