阿里巴巴申请文本处理相关专利,提高了模型训练的准确率
创始人
2024-09-13 00:40:47
0

金融界2024年9月11日消息,天眼查知识产权信息显示,阿里巴巴(中国)有限公司申请一项名为“文本处理模型的训练方法、文本处理方法、问答处理方法及装置“,公开号CN202410711037.9,申请日期为2024年6月。

专利摘要显示,本申请实施例公开了一种文本处理模型的训练方法、文本处理方法、问答处理方法及装置,涉及人工智能技术领域。方法包括:获取多个训练样本,训练样本至少包括文本样本;利用多个训练样本,将大语言模型作为教师模型进行蒸馏,得到作为学生模型的文本处理模型,文本处理模型的参数规模小于所述大语言模型;其中在蒸馏的过程中,利用大语言模型针对文本样本预测的POT(思维程序)信息和COT(思维链)信息指导文本处理模型的训练。本申请通过利用大语言模型预测的POT信息和COT信息共同指导文本处理模型的训练,提高了模型训练的准确率。

来源:金融界

相关内容

热门资讯

【行业动态】国家数据局:培育壮... 据国家数据局网站20日消息,5月19日上午,国家发展改革委党组成员、国家数据局局长刘烈宏主持召开数据...
贵州省公路建养集团首届无人机职... 5月18日至20日,贵州省公路建设养护集团首届无人机职业技能大赛在贵州高速黔通建设工程有限公司无人机...
新一代“星舰”首飞,完成大部分... 据央视新闻消息,美国太空探索技术公司重型运载火箭“星舰”22日实施第12次试飞。这是新一代“星舰”系...
委内瑞拉代总统访问邻国计划突然... 3月13日消息,委内瑞拉和哥伦比亚两国政府12日发表联合声明,宣布因“不可抗力”临时取消原定于13日...
百度健康内测医生专业版“龙虾”... 3月13日消息,百度健康正式启动医生专业版“龙虾”内测,内部代号DoctorClaw,这也是行业首个...
医疗耗材股持续走高,中红医疗、... 3月13日消息,医疗耗材股持续走高,中红医疗、英科医疗逼近20cm涨停,此前奥美医疗、蓝帆医疗涨停,...
商务部新闻发言人就美贸易代表办... 3月13日消息,商务部新闻发言人就美贸易代表办公室宣布以“产能过剩”为由对包括中国在内的16个经济体...
国家启动国储氮磷及复合肥提前投... 3月13日消息,据中国农业生产资料流通协会,为保障春耕期间农业生产集中用肥需要,国家有关部门决定即日...
沪深京三市成交额超2万亿元,较... 3月13日消息,沪深京三市成交额超2万亿元,较上日此时缩量1396亿元,预计全天成交金额约2.3万亿...
日韩股市集体收跌 3月13日消息,日经225指数收跌1.16%,报53819.61点;韩国KOSPI指数收跌1.72%...