9月18日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》第645期的封面。具体来看,与今年1月发布的DeepSeek-R1的初版论文相比,此次论文披露了更多模型训练的细节,并对发布初期外界有关“蒸馏”方法的质疑作出了正面回应。
上证报中国证券网讯(记者 马嘉悦)9月18日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型研究论文,登上了国际权威期刊《自然(Nature)》第645期的封面。
具体来看,与今年1月发布的DeepSeek-R1的初版论文相比,此次论文披露了更多模型训练的细节,并对发布初期外界有关“蒸馏”方法的质疑作出了正面回应。
值得一提的是,该论文发布后,DeepSeek-R1成为全球首个经过同行评审的主流大语言模型。Nature评价称,目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。