百川智能和零一万物否认停止预训练大模型
创始人
2024-10-14 02:00:52
0

来源:@经济观察报微博

经济观察网 记者 任晓宁 10月12日,针对旗下大模型已经停止预训练的传言,零一万物和百川智能均对经济观察网做了否认。

近日有传言称,“大模型六小虎”中已有两家企业停止预训练。“大模型六小虎”通常被业界用来形容6家头部大模型创业公司,包括智谱、MiniMax、百川智能、零一万物、阶跃星辰、月之暗面。

其中有几家公司近期出现了较大的动作。智谱与MiniMax发布了视频模型,月之暗面发布大模型版本更新,阶跃星辰发布了万亿参数大模型。相比而言,百川智能和零一万物今年动作较小,因此被外界猜测是已停止预训练的两家企业。

预训练是一种深度学习模型的训练策略,这种策略可以让模型学习到更多信息,不断提高模型性能。停止预训练,意味着企业将不再投入资源研发新模型,而是利用已有的模型进行应用开发,企业的发展方向将发生重大变化。

对于上述传言,零一万物创始人李开复10月11日晚上在朋友圈发文说,零一万物一直在做预训练,去年和今年发布的Yi-34B、Yi-Large、Yi-Coder、Yi- VL、Yi-Vision都是发布时全球第一梯队,国内领先的预训练模型。而且零一万物的新预训练模型也即将推出。

据经济观察网了解,李开复所说的新预训练模型将于下周发布。

百川智能也否认了停止预训练的说法。百川智能向经济观察网回应,百川智能的预训练团队稳定,预训练工作正在稳步推进,并不存在放弃预训练一说。

今年5月,百川智能发布了千亿参数模型Baichuan 4,其今年的重点发展方向是AI医疗。百川智能方面称,其在基础模型和AI应用方面均取得了阶段性进展,相关成果将很快面世。

今年以来,有一批大模型公司停下了研发的脚步。据经济观察网统计,截至2024年10月9日,在188个通过网信办生成式人工智能备案的大模型中,超过三成的大模型在通过备案后未进一步公开其进展情况,仅有约一成的大模型仍在加速训练,接近一半的大模型转向了AI应用的开发。

一位大模型技术人士告诉经济观察网,预训练既要烧钱又要烧数据,对中小公司来说,当投入与回报不成正比时,及时止损是正确的选择。但同时,预训练模型也是大模型公司的底层核心技术,头部公司和大厂不能停止预训练,停了就意味着走下牌桌。

相关内容

热门资讯

绑定高奢酒店出圈,圣贝拉为何上... 作者 | 黄绎达 编辑 | 张帆 头顶“全球家庭品质护理第一股”的光环,以经营高奢月子中心著称的圣贝...
1.27亿广西云大单!京东拿下 智东西 作者 | 程茜 编辑 | 李水青 智东西12月17日消息,12月16日,广西南宁(中国-东盟...
中医AI诊疗设备领域标杆企业权... 中医AI诊疗设备领域标杆企业权威榜单解析 在中医药现代化发展的浪潮中,以AI技术为核心的智能化诊疗设...
凡人修仙传:如果韩立没有加入落... 在《凡人修仙传》中,韩立的角色对落云宗及宗门中众人的命运产生了深远的影响。如果没有韩立的出现,落云宗...
千寻位置BG1101系列车规级... 上证报中国证券网讯(记者 于祥明)记者12月17日从千寻位置网络有限公司(简称“千寻位置”)获悉,近...
安全载客超3000万人次,C9... 近日,在喀什飞往伊宁的华夏航空G54969航班上,国产C909飞机迎来了第3000万名乘客。自201...
假如邛崃的冬天毛茸茸的→ 📍酒业梦工场: 是邛崃酒业发展的新引擎。它位于新南桥头,是一座大型单体环型建筑,致力于打造酒业生态圈...
全国降水榜凑不出前十 专家解读... 近日,我国大部地区雨雪持续稀少,今天13时,全国降水榜上凑不齐十个达到或超过0.1毫米降水的国家级气...
【六院新闻】第二十一届医院管理... 上海市第六人民医院医疗集团与上海市医院协会自2005年起,已连续二十年携手打造医院管理论坛,成为推动...
深圳如何锚定开放新坐标,实现制... 南都讯 2025年12月10日至11日,中央经济工作会议在北京举行,会议将“坚持对外开放,推动多领域...