国产AI大模型高考成绩单出来了:讯飞星火获得综合第一
创始人
2024-06-11 15:22:06
0

随着高考的落幕,全国各地的高三学子们终于可以卸下沉重的负担,轻松迎接假期。与往年不同的是,今年的高考战场上还有一支与众不同的队伍引人注目——国产人工智能大模型。

在这场特殊的高考中,包括搜狐科技、潇湘晨报、量子位等多家权威媒体对近10款国产人工智能大模型进行了高考作文、数学、物理三个科目的评测,并公布了成绩。我们来一起回顾一下:

首先进行的是高考作文的评测。在搜狐科技的评测中,三位资深语文教师作为权威专家为各大模型的作文打分。腾讯元宝和百度文心一言以超过50分的成绩位居前列,智谱清言、字节豆包与讯飞星火则并列第三。Kimi、阿里通义、百川、海螺排名相对靠后。

而在潇湘晨报的“AI写作”评测中,讯飞星火不仅平均分位居首位,且获得了全场最高分56分。潇湘晨报邀请湖南知名作家、编辑作为阅卷老师,对国内五大AI大模型产品——百度文心一言、讯飞星火、阿里通义千问、字节豆包、腾讯元宝的高考作文进行评分,经过四位阅卷老师的综合打分,讯飞星火以49分的平均分高居首位。

给讯飞星火打出“全场最高分”56分的阅卷老师表示:“本文观点清晰,论述集中且层层推进,很多句子都简洁有力,颇有思想性。如果是某个学生写的,无疑是难得的佳作。”另外,从网友的热门评论中也能看出讯飞星火摘得高分的原因。

网友@2024:感觉星火好点,更像作文,有些更像回答问题。

网友@烟花绽放的节日:讯飞星火更有高考味。

接下来是数学科目的较量。在搜狐科技的数学评测中,讯飞星火、文心一言、豆包均以63%的正确率位列第一梯队,智谱清言、阿里通义则以50%的正确率位居第二梯队,其他大模型相对落后。

在量子位的高考数学评测中,虽然没有给出详细成绩单,但展示了各家大模型详细的解题思路,交由网友打分,通过网友的投票打分可以看出,讯飞星火的“识图+解数学题”能力收到了最高认可,位居其后的分别是Kimi、通义千问、文心一言、豆包等。

最后是高考物理的测试。在量子位的评测中,阿里通义千问与讯飞星火以71.4%的准确率高居第一梯队,而Kimi、海螺和腾讯元宝则以42.9%的准确率位于第二梯队。百川百小应和万知答对一题位于第三梯队。

文心一言、豆包、天工、智谱清言、商量因为出现了不同程度读图失败的问题,在成功识别的题目中,商量和文心一言的正确率为2/4,即正确率为28.6%;豆包、天工、智谱清言正确率为1/2,即正确率为14.3%。

综合以上媒体在作文、数学、物理三门科目的成绩,我们得出了2024年人工智能大模型高考“成绩单”。来自科大讯飞的讯飞星火以52.49分高居第一名,通义千问、文心一言分别位列第二、第三名,而Kimi、字节豆包、海螺AI等其他大模型也有不错的表现。

第一名:52.49 讯飞星火

第二名:46.08 通义千问

第三名:37.67 文心一言

第四名:34.68 Kimi

第五名:33.57 字节豆包

第六名:31.92 海螺AI

第七名:30.61 腾讯元宝

第八名:30.28 智谱清言

第九名:21.56 百川百小应

尽管评测方式可能不够严谨科学,但这次大模型高考无疑展示了国产人工智能在多个学科的优秀表现和长足进步,尤其是讯飞星火的表现堪称“文理兼修”!期待国产大模型再接再厉,在明年的高考中取得更加出色的成绩!

相关内容

热门资讯

移动手机卡套餐套路多?2025... 办卡关注公众号:找卡星球 这里将是您揭秘流量卡真相、探索优质正规流量卡办理的一站式平台。让我们一起,...
原创 荷... 据澎湃新闻报道,10月21日这天,国际经贸领域的目光都聚焦在两场特殊的对话上——中国商务部长王文涛先...
沈阳自动化所提出面向存储加密超... 日前,中国科学院沈阳自动化研究所与香港城市大学科研团队开展合作,通过开发动态光化学能量转换超材料,提...
百亿级人类基因组基础模型发布 本报电(华轩)近日,在第二十届国际基因组学大会上,华大生命科学研究院与之江实验室联合发布了百亿参数人...
最后一个没有广告的地图,要消失... 彭博社的 Mark Gurman 爆料称,苹果正计划最早明年,在地图 app 里引入广告。 形式可能...
透视ai代打!aapoker怎... 透视ai代打!aapoker怎么选牌,aapoker辅助工具安全吗,解密教程(有挂细节)1、不需要A...
透视免费!aapoker公共底... 透视免费!aapoker公共底牌,aapoker透视方法,实用技巧(有挂插件)1、上手简单,内置详细...
透视挂透视!aapoker脚本... 透视挂透视!aapoker脚本怎么用,aapoker ai插件,教你教程(有挂解密);1、在aapo...
“奋斗者”号回到三亚 载人深潜... 新华社海口10月27日电(记者刘诗平、王立彬)由自然资源部和中国科学院共同组织、依托“探索三号”及“...
南岸加速打造西部智慧交通“领跑... 10月27日,“城市更新与智慧交通学术交流暨成果转化分论坛”在我区顺利举行。这场由重庆市科学技术协会...