不同AI大模型匿名打PK:字节跳动扣子平台上线“模型广场”
创始人
2024-06-14 18:22:13
0

字节跳动“扣子 Coze”公众号今日宣布,扣子平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。

IT之家附具体操作:

用户可以在扣子官网(coze.cn)左侧导航栏中的“探索”列表找到“模型广场”,进入功能。其对战模式分为“随机 Bot 对战”“指定 Bot 对战”“纯模型对战”三种。

随机 Bot 对战:系统随机选择一个 Bot 进行模型对战,适用于评测模型在任意业务场景下的文本生成、技能和知识调用等能力。用户可以选择一个感兴趣的 Bot,扣子将随机选取两个匿名模型,基于 Bot 的编排、工作流、知识库等能力配置回答你的问题。

指定 Bot 对战:指定 Bot 进行模型对战,适用于评测模型在指定细分领域的文本生成、技能和知识调用等能力。扣子将从上架 Bot 中随机选择一个 Bot,并随机选择两个匿名模型,基于 Bot 的编排、工作流、知识库等能力配置回答你的问题。

纯模型对战:不指定任何 Bot,系统随机选择两个模型展开对决。模型回答不受编排、工作流等配置的限制和影响,适用于评测模型本身的文本生成等能力。

在完成对战后,用户可以选择模型A 表现更好、两个都好、两个都差或模型 B 表现更好,投票将影响模型的评分。在投票后,页面将揭晓两个模型的胜负方、真实名称、详细配置,用户也可以将对战结果分享出去。

来源:IT之家

相关内容

热门资讯

2026年度人形机器人与具身智... 记者9日从工业和信息化部获悉,工业和信息化部、国务院国资委联合印发通知,正式启动2026年度人形机器...
阳江检测院高效完成白鹤滩号电梯... 近日,广东省特种设备检测研究院阳江检测院紧急完成全球首艘2000吨级自升自航式海上风电安装平台“白鹤...
真健康医疗IPO:最值钱的环节... 文 | 市值水晶 98.3%对15%的穿刺成功率,是一次精准的降维打击。调针次数从1.42次降到0...
科力电子取得桌面电源适配器专利... 国家知识产权局信息显示,厦门市科力电子有限公司取得一项名为“桌面电源适配器”的专利,授权公告号CN2...
199元!诺基亚小屏手机评测:... 诺基亚又出新机了。前段时间,好不容易续上诺基亚品牌授权的HMD,在国内推出了旗下首款“微聊手机”——...
原创 英... 6月7日,北京高考考场。 28岁的薛女士第二次坐在了这里。在她身边,是一群刚刚18岁、脸上还带着稚气...
明纪释法丨违规选任干部或用人失... 广西壮族自治区融安县纪委监委通过召开案情研判会,学习梳理《中国共产党纪律处分条例》相关规定,结合具体...
6G来了,你的手机卡准备好了吗... 你有没有想过,你现在用的手机卡,5年后还能用吗? 2025年,全球多个国家已经开始了6G的商用测试...
SpaceX的上市愿景,系于星... 来源:环球市场播报 马斯克想要将人类送上火星,并推动SpaceX完成史上规模最大的首次公开募股,而这...