OpenAI曾秘密测试GPT-4o,登顶聊天机器人竞技场排行榜
创始人
2024-05-14 19:33:44
0

原标题:OpenAI曾秘密测试GPT-4o,登顶聊天机器人竞技场排行榜

IT之家 5 月 14 日消息,OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

聊天机器人竞技场是一个网站,访客可以同时与两个随机的 AI 语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年 4 月份开始,OpenAI 在竞技场测试了多个版本的 GPT-4o,该模型最初以“gpt2-chatbot” 的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自 GPT-4o 今日发布以来,多方消息人士透露,该模型以巨大优势登顶了 LMSYS 的内部排行榜,超越了之前排名最高的模型 Claude 3 Opus 和 GPT-4 Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约 50 Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot” 的 Elo 分数为 1309,领先于 GPT-4-Turbo-2023-04-09 的 1253 分和 Claude 3 Opus 的 1246 分。在三个“gpt2-chatbot” 出现并搅局之前,Claude 3 和 GPT-4 Turbo 一直在排行榜上争夺冠军。

相关内容

热门资讯

日本人重拾算盘,帮助孩子在数字... 参考消息网10月19日报道据英国《泰晤士报》网站10月9日报道,从个人印章到传真机和软盘,日本人对过...
【信物见精神·有声手账】呼号X... 【赓续星火 再启新程——信物见精神】 本期信物:延安新华广播电台发射机(中国国家博物馆藏) “延安新...
中关村(京西)人工智能科技园开... 来源:@中国经营报微博 【中关村(京西)人工智能科技园开园,打造全产业链创新高地】10月19日,中关...
中科大发文追忆杨振宁:当名誉教... 仍怜故乡水,万里送行舟——杨振宁与中国科学技术大学 享誉世界的物理学家、诺贝尔物理学奖获得者,中国科...
江西签约14个VR产业项目 总... 上证报中国证券网讯(记者 王凯丰)10月19日,在江西省虚拟现实(VR)产业招商推介大会上,14个项...
拓荆科技公布“一种抽气环及薄膜... 天眼查APP显示,近日,拓荆科技股份有限公司申请的“一种抽气环及薄膜沉积设备”专利公布。 摘要显示,...
百岁杨振宁:我的人生走了一个圈 2025年10月18日,物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研...
百年求索,赤子之心 ——致敬科... 享誉世界的物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研究院名誉院长杨...
时光相册丨在影像中缅怀杨振宁先... 2025年10月18日 诺贝尔物理学奖得主 中国科学院院士 著名物理学家杨振宁 因病于北京逝世 享年...
翁帆:他交出了一份满意的答卷 享誉世界的物理学家、诺贝尔物理学奖获得者,中国科学院院士,清华大学教授、清华大学高等研究院名誉院长杨...