大模型高考全卷评测结果出炉:最高分303,数学全不及格
创始人
2024-06-20 09:21:28
0

大模型之家讯 6月19日,上海人工智能实验室的司南评测体系OpenCompass公布了其首次针对七个大模型进行的高考“语数外”全卷能力测试结果。在这项测试中,阿里通义千问2-72B以303分的优异成绩位列榜首,紧随其后的是OpenAI的GPT-4o,获得了296分。上海人工智能实验室自家的书生·浦语2.0则以出色的表现位列第三,三个大模型的得分率均超过了70%。

这次高考全卷评测的总分为420分,涵盖了语文、数学和外语三科。从结果来看,尽管这些大模型在语文和英语方面普遍表现出色,但在数学科目上却遭遇了滑铁卢,最高得分仅为75分,无一及格。这一结果也揭示了当前大模型在特定领域,尤其是数学领域的局限性。

值得注意的是,此次排名末尾的是来自法国大模型初创公司的Mistral。尽管Mistral在其他领域可能有着不俗的表现,但在这次高考全卷评测中,其成绩显然未能达到预

相关内容

热门资讯

黑科技好牌(微扑克规律)外挂透... 黑科技好牌(微扑克规律)外挂透明挂辅助插件(透视)介绍教程(2021已更新)(哔哩哔哩);1、首先打...
黑科技插件(微扑克大厅)外挂透... 黑科技插件(微扑克大厅)外挂透明挂黑科技辅助挂(透视)必备教程(2021已更新)(哔哩哔哩)1、在微...
黑科技游戏!wpk透视辅助工具... 黑科技游戏!wpk透视辅助工具,太夸张了本来存在有挂(透视)解说技巧(2020已更新)(哔哩哔哩)一...
第2分钟了解!wepower透... 第2分钟了解!wepower透视外挂,途游暗宝辅助器,教你攻略(确实有挂)-哔哩哔哩;1、第2分钟了...
黑科技新版(Wepoke机制)... 黑科技新版(Wepoke机制)外挂透明挂辅助挂(透视)德州教程(2026已更新)(哔哩哔哩)1、We...
黑科技规律!wepoke有辅助... 黑科技规律!wepoke有辅助挂,太夸张了一直是真的有挂(透视)第三方教程(2020已更新)(哔哩哔...
黑科技最新(红龙软件德州扑克)... 自定义红龙软件德州扑克系统规律,只需要输入自己想要的开挂功能,一键便可以生成出微扑克专用辅助器,不管...
七分钟了解!wepoke辅助软... 七分钟了解!wepoke辅助软件靠谱吗,jj斗地主系统控牌吗,软件教程(有挂秘笈)-哔哩哔哩1、jj...
黑科技新版(wpkai)外挂透... 黑科技新版(wpkai)外挂透明挂辅助ai(透视)细节方法(2020已更新)(哔哩哔哩)1、首先打开...
黑科技ai挂!微扑克智能ai辅... 黑科技ai挂!微扑克智能ai辅助,太坑了一贯真的有挂(透视)必备教程(2020已更新)(哔哩哔哩)1...