OpenAI曾秘密测试GPT-4o,登顶聊天机器人竞技场排行榜
创始人
2024-05-14 19:33:44
0

原标题:OpenAI曾秘密测试GPT-4o,登顶聊天机器人竞技场排行榜

IT之家 5 月 14 日消息,OpenAI 员工 William Fedus 周一在社交平台 X 证实,近期在 LMSYS 聊天机器人竞技场 (Chatbot Arena) 上表现优异的神秘聊天机器人“gpt-chatbot”,正是他们刚刚发布的全新人工智能模型 GPT-4o。Fedus 还透露,GPT-4o 在测试中登顶了竞技场排行榜,取得了有史以来的最高分。

“GPT-4o 是我们最先进的尖端模型,”Fedus 在推特上写道,“我们一直在竞技场使用‘im-also-a-good-gpt2-chatbot’的名称测试该模型的一个版本。”

聊天机器人竞技场是一个网站,访客可以同时与两个随机的 AI 语言模型对话,却不知道哪个是哪个,然后选择提供更好回复的模型。

从今年 4 月份开始,OpenAI 在竞技场测试了多个版本的 GPT-4o,该模型最初以“gpt2-chatbot” 的名称出现,然后变成了“im-a-good-gpt2-chatbot”,最后是“im-also-a-good-gpt2-chatbot”。

自 GPT-4o 今日发布以来,多方消息人士透露,该模型以巨大优势登顶了 LMSYS 的内部排行榜,超越了之前排名最高的模型 Claude 3 Opus 和 GPT-4 Turbo。

lmsys.org的官方账号分享了一张图表,并写道:“‘gpt2-chatbot’系列模型刚刚飙升至榜首,以显著的优势(约 50 Elo)超越了所有其他模型,它已经成为竞技场中最强大的模型。这是一张内部截图,公开版本的‘gpt-4o’现已进入竞技场,并很快将出现在公开排行榜上!”

截至IT之家发稿时,“im-also-a-good-gpt2-chatbot” 的 Elo 分数为 1309,领先于 GPT-4-Turbo-2023-04-09 的 1253 分和 Claude 3 Opus 的 1246 分。在三个“gpt2-chatbot” 出现并搅局之前,Claude 3 和 GPT-4 Turbo 一直在排行榜上争夺冠军。

相关内容

热门资讯

9分钟攻略!胡乐app有挂吗,... 9分钟攻略!胡乐app有挂吗,四川游戏家园茶馆系统(原来一直都是有挂)1、下载好四川游戏家园茶馆系统...
最新技巧!鄱阳麻将软挂神器,广... 最新技巧!鄱阳麻将软挂神器,广东老友麻将有没有挂,雀神开外挂专用辅助器下载安装(详细教程)鄱阳麻将软...
实测揭晓!!德州辅助神器wpk... 实测揭晓!!德州辅助神器wpk,兴动互娱扑克辅助器,科技教程(有挂工具)1、构建自己的兴动互娱扑克辅...
8分钟辅助挂!66红中麻将究竟... 8分钟辅助挂!66红中麻将究竟真的有挂吗,中至麻将系统好像真的有挂,透牌教程(有挂技巧)1、每一步都...
4分钟插件!jj麻将好友房有没... 4分钟插件!jj麻将好友房有没有挂,杭州都莱双扣辅助器是真是假(其实者的有挂);1、杭州都莱双扣辅助...
查到实测辅助!gg扑克赢了,鄂... 查到实测辅助!gg扑克赢了,鄂州晃晃辅助器,揭秘攻略(有挂脚本)1、鄂州晃晃辅助器系统规律教程、鄂州...
专业讨论!科乐长乐麻将如何提高... 专业讨论!科乐长乐麻将如何提高胜率,东游麻将胡牌神器,微信雀神麻将系统规律(详细教程);1、游戏颠覆...
三分钟辅助挂!开心联盟有没有外... 三分钟辅助挂!开心联盟有没有外 挂,开元金花透明都是真的有挂,必赢教程(有挂技巧);1、进入到开心联...
推荐一款!!线上wpk德州ai... 推荐一款!!线上wpk德州ai机器人,胡乐辅助器免费版下载,AI教程(有挂揭秘);进入游戏-大厅左侧...
7分钟方法!牛郎棋牌助手黑科技... 7分钟方法!牛郎棋牌助手黑科技,红心吴江麻将有挂吗(原来总是有挂);1、用户打开应用后不用登录就可以...