维 辰
我国有多少大模型?从许多人的使用经验看,能盘点出来10个已属罕见。让人意想不到的是,当前,我国已发布1509个大模型,在全球已发布的3755个大模型中数量位居首位。
早在2020年,美国就推出了11个大模型,彼时,我国只推出了2个人工智能大模型。2022年末,ChatGPT横空出世,在全球范围掀起大模型之争。短短几年时间,我国大模型数量就超越美国位居全球首位,展现出强大的市场活力和发展潜力。国产大模型经历了2023年的“百模大战”、2024年的“大浪淘沙”之后,人们也更加关注数量背后的成色。
“百模大战”引发了“重复建设”质疑,不少人认为国产大模型“多而不强”,有的进一步提出,作为一种基础设施,全国甚至全球只会有个位数的大模型能活下来,因而“根本没有必要出那么多大模型”。一方面,的确有个别企业跟风开发大模型,“人工智能时代,没有大模型的科技企业就意味着落伍”,也有企业陷入套壳国外开源大模型、拼装大模型争议,避免低水平重复建设的提醒值得重视。另一方面,正如一些学者所说,纵观人工智能发展史,多种技术、多条路线共同探索,是让人工智能得以一次次走出“寒冬”、快速发展的重要原因。从“百家争鸣”到“大浪淘沙”,其实是必经之路。
多份报告指出,美国和中国稳居人工智能创新发展的第一梯队,总分大幅领先其他国家。美国在生产顶级AI模型上依然保持领先地位,但中美AI模型性能差距正大幅和迅速缩小,此外,我国在高价值专利数量、风险投资规模等方面仍有较大提升空间。当前,随着大模型技术演进曲线走向平缓,以及高质量训练数据愈加枯竭,大模型性能差距显著收窄。领跑者速度变慢,为我国进一步缩小差距提供了时间窗口。同时也不容忽视,相比广泛应用的英文,中文语料尤其是高质量中文语料更加缺乏,基于庞大数据和超高算力的“暴力美学”不可持续。大模型开发从盲目崇拜参数规模转向更加注重精准有效,成为破题关键。
让大模型更加精准、更具落地价值,是企业证明其商业模式可持续性的必然选择。毕竟,大模型研发既需要技术积淀,也需要资金规模。在国内用户付费意愿不高、选择较多的背景下,同质化、功能简单的大模型可能面临生存危机。为此,不少人认为行业或将从“淘汰赛”进入到更为激烈的“生死战”,竞争将转向场景深水区:谁能更好地推进大模型落地应用,解决具体场景中的痛点,谁就能赢得主动权。