阿里通义实验室智能计算团队推出新算法FIPO_科技资讯

阿里通义实验室智能计算团队推出新算法FIPO

创始人

2026-06-21 08:15:05

0次

4月7日消息，阿里通义实验室智能计算团队宣布推出新算法FIPO（Future-KL Influenced Policy Optimization），引入Future-KL机制，奖励关键Token，解决纯强化学习（Pure RL）训练中“推理长度停滞”难题。据该团队介绍，在32B规模的纯RL设定下，率先实现对o1-mini与同规模DeepSeek-Zero-MATH的性能反超。（广角观察）

上一篇：伊朗终止同美国直接外交联系

下一篇：苹果跌幅扩大至4%

热门资讯

俄“能源”火箭航天集团：俄罗斯... 4月8日消息，据报道，俄罗斯轨道站总设计师、俄“能源”火箭航天集团副总设计师科热夫尼科夫表示，俄罗斯...

部分期货品种夜盘收盘，能化品种... 4月8日消息，部分期货品种夜盘收盘，多数品种下跌，低硫燃料油、乙二醇、甲醇跌5%，LPG、燃油跌超4...

联邦快递计划6月1日完成货运业... 4月8日消息，联邦快递公司披露，计划当地时间6月1日完成联邦快递货运业务的分拆工作，届时后者将成为一...

东航物流：联想控股拟27.17... 4月8日消息，东航物流公告称，公司持股5%以上股东联想控股与中国物流集团资本管理有限公司签署股份转让...

马士基暂不恢复霍尔木兹航线 4月8日消息，丹麦马士基航运公司8日说，美国和伊朗宣布停火尚不能充分保障霍尔木兹海峡的通行安全，公司...

美防长：伊朗绝不能拥有核武器 4月8日消息，美国国防部长赫格塞斯当地时间8日表示，美国对伊朗核问题的立场“始终不可谈判”，强调伊朗...

渣打调查：企业人民币营运敞口与... 4月8日消息，据报道，渣打集团对全球19个行业近300家大型企业的调查显示，受访企业23%的收入和受...

国家金融监管总局：聚焦稳定粮油... 4月8日消息，国家金融监督管理总局发布《关于做好2026年金融支持乡村全面振兴工作的通知》。《通知》...

腾讯控股今日以10亿港元回购近... 4月8日消息，腾讯控股公告，4月8日耗资10亿港元回购197.9万股，每股购回价501-510港元。...

达美航空预计第二季度高端燃油成... 4月8日消息，达美航空预计第二季度高端燃油成本将增加超过20亿美元。（广角观察）

阿里通义实验室智能计算团队推出新算法FIPO

相关内容

热门资讯