大模型高考全卷评测结果出炉:最高分303,数学全不及格
创始人
2024-06-20 09:21:28
0

大模型之家讯 6月19日,上海人工智能实验室的司南评测体系OpenCompass公布了其首次针对七个大模型进行的高考“语数外”全卷能力测试结果。在这项测试中,阿里通义千问2-72B以303分的优异成绩位列榜首,紧随其后的是OpenAI的GPT-4o,获得了296分。上海人工智能实验室自家的书生·浦语2.0则以出色的表现位列第三,三个大模型的得分率均超过了70%。

这次高考全卷评测的总分为420分,涵盖了语文、数学和外语三科。从结果来看,尽管这些大模型在语文和英语方面普遍表现出色,但在数学科目上却遭遇了滑铁卢,最高得分仅为75分,无一及格。这一结果也揭示了当前大模型在特定领域,尤其是数学领域的局限性。

值得注意的是,此次排名末尾的是来自法国大模型初创公司的Mistral。尽管Mistral在其他领域可能有着不俗的表现,但在这次高考全卷评测中,其成绩显然未能达到预

相关内容

热门资讯

透视积累!wepoker底牌透... 透视积累!wepoker底牌透视脚本(透视)开挂透视下载(哔哩哔哩)1、该软件可以轻松地帮助玩家将w...
透视指引!hh poker透视... 透视指引!hh poker透视器下载(透视)开挂透视下载(哔哩哔哩)1、完成hh poker透视器下...
透视机巧!wepoker有没有... 透视机巧!wepoker有没有挂(透视)开挂脚本安装(哔哩哔哩)所有人都在同一条线上,像星星一样排成...
透视模块!wepoker辅助真... 透视模块!wepoker辅助真的假的(透视)开挂脚本修改器(哔哩哔哩)1、这是跨平台的wepoker...
透视机巧!hhpoker脚本(... 透视机巧!hhpoker脚本(透视)开挂脚本辅助器(哔哩哔哩)1、上手简单,内置详细流程视频教学,新...
透视阶段!aapoker辅助软... 透视阶段!aapoker辅助软件合法吗(透视)开挂透视工具(哔哩哔哩)1、下载好aapoker辅助软...
透视法子!wepoker怎么设... 透视法子!wepoker怎么设置盖牌(透视)开挂脚本app(哔哩哔哩)1)wepoker怎么设置盖牌...
透视机巧!wpk辅助软件(透视... 透视机巧!wpk辅助软件(透视)开挂脚本工具(哔哩哔哩);1、全新机制【wpk辅助软件ai辅助工具激...
透视操作!哈糖大菠萝辅助器(透... 透视操作!哈糖大菠萝辅助器(透视)开挂脚本app(哔哩哔哩)1、任何哈糖大菠萝辅助器透视是真的假的的...
透视法子!德州机器人代打脚本(... 透视法子!德州机器人代打脚本(透视)开挂透视神器(哔哩哔哩)1、进入到德州机器人代打脚本是否有挂之后...