大模型高考全卷评测结果出炉:最高分303,数学全不及格
创始人
2024-06-20 09:21:28
0

大模型之家讯 6月19日,上海人工智能实验室的司南评测体系OpenCompass公布了其首次针对七个大模型进行的高考“语数外”全卷能力测试结果。在这项测试中,阿里通义千问2-72B以303分的优异成绩位列榜首,紧随其后的是OpenAI的GPT-4o,获得了296分。上海人工智能实验室自家的书生·浦语2.0则以出色的表现位列第三,三个大模型的得分率均超过了70%。

这次高考全卷评测的总分为420分,涵盖了语文、数学和外语三科。从结果来看,尽管这些大模型在语文和英语方面普遍表现出色,但在数学科目上却遭遇了滑铁卢,最高得分仅为75分,无一及格。这一结果也揭示了当前大模型在特定领域,尤其是数学领域的局限性。

值得注意的是,此次排名末尾的是来自法国大模型初创公司的Mistral。尽管Mistral在其他领域可能有着不俗的表现,但在这次高考全卷评测中,其成绩显然未能达到预

相关内容

热门资讯

透视安卓版!we poker辅... 透视安卓版!we poker辅助器下载,wepoker分析(原来有挂)1、在we poker辅助器下...
透视科技(WPK)原来是有挂(... 透视科技(WPK)原来是有挂(透视)wpk透视辅助(普及教程);wpk透视辅助是一种具有地方特色的麻...
透视代打!aapoker脚本怎... 透视代打!aapoker脚本怎么用(透视)万能辅助器(确实真的有挂);1.aapoker脚本怎么用 ...
透视辅助!wepoker游戏下... 透视辅助!wepoker游戏下载,we poker辅助器v3.3(一直是真的有挂)1、we poke...
透视了解(WPK)真是有挂(透... 透视了解(WPK)真是有挂(透视)wpk真吗(透牌教程)1、玩家可以在wpk真吗软件透明挂俱乐部对游...
透视玄学!aapoker怎么控... 透视玄学!aapoker怎么控制牌(透视)免费透视脚本(好像有挂)1、点击下载安装,aapoker怎...
透视教学!wepoker私人局... 透视教学!wepoker私人局辅助器怎么用,wepoker透视脚本是什么(切实是有挂)1、玩家可以在...
透视ai代打!aapoker如... 透视ai代打!aapoker如何设置胜率(透视)可以选牌(一贯有挂)1)aapoker如何设置胜率辅...
透视透视(WPK)切实存在有挂... 透视透视(WPK)切实存在有挂(透视)wpk俱乐部有没有辅助(攻略教程)1、完成wpk俱乐部有没有辅...
透视系统!wepoker私人局... 透视系统!wepoker私人局俱乐部辅助,wepoker免费脚本咨询(切实是真的有挂);一、wepo...