Anthropic 推出 Claude 3.5 Sonnet AI 模型
创始人
2024-06-21 10:01:30
0

IT之家 6 月 21 日消息,Anthropic 今天(6 月 21 日)推出了 Claude 3.5 Sonnet,这是 Claude 3.5 系列的首个模型版本,在各项评估中优于 OpenAI 的 GPT-4o 和谷歌的 Gemini 1.5 Pro。

Claude 3.5 Sonnet 在前代的基础上迭代升级,性能更快,编码、视觉和自然语言理解能力更强。

Claude 3.5 Sonnet 属于中等尺寸模型,介于小型 Haiku 和高端 Opus 之间,但 Anthropic 声称,根据内部基准测试,Sonnet 的性能甚至超过了顶级 Opus。

据 Anthropic 称,Claude 3.5 Sonnet 处理输入的速度是 Opus 的两倍。该公司称,在编码挑战方面,Sonnet 超越了之前的 Opus 模型,修复了 64% 的代码错误,而 Opus 只有 38%。

基准测试结果还显示,Sonnet 在 9 个总体类别中的 7 个类别、5 个视觉任务中的 4 个任务上击败了竞争对手。

IT之家翻译官方新闻稿如下:

Claude 3.5 Sonnet 是我们迄今为止最强大的视觉模型,在标准视觉基准测试中超过了 Claude 3 Opus,在解读图表等需要视觉推理的任务中,这些阶跃式的改进最为明显。

Claude 3.5 Sonnet 还能从不完美的图像中准确地转录文本,这是零售、物流和金融服务的核心能力,在这些领域,人工智能可能会从图像、图形或插图中获得比单纯从文本中获得更多的洞察力。

为确保安全,Anthropic 将 Sonnet 提交给英国和美国人工智能安全研究所进行外部评估。他们发现,经过改进后,该模型仍处于 ASL 2 级水平。Anthropic 还利用儿童安全专业知识对助手进行了更新,以更好地预防潜在伤害。

相关内容

热门资讯

原创 英... 6月7日,北京高考考场。 28岁的薛女士第二次坐在了这里。在她身边,是一群刚刚18岁、脸上还带着稚气...
明纪释法丨违规选任干部或用人失... 广西壮族自治区融安县纪委监委通过召开案情研判会,学习梳理《中国共产党纪律处分条例》相关规定,结合具体...
6G来了,你的手机卡准备好了吗... 你有没有想过,你现在用的手机卡,5年后还能用吗? 2025年,全球多个国家已经开始了6G的商用测试...
SpaceX的上市愿景,系于星... 来源:环球市场播报 马斯克想要将人类送上火星,并推动SpaceX完成史上规模最大的首次公开募股,而这...
【工业强县 企业巡礼】浙南智造... 工业强县·企业巡礼 浙南智造:数智破局 抢占精密制造新赛道 乘势而上 智改增效 笃行实干 工业强县·...
苹果音乐怎么在安卓播?几款靠谱... M4A 作为苹果生态中广泛使用的音频格式,以其优秀的音质和压缩率备受青睐。然而,当我们将这些音乐文件...
商业航天板块今日回调,卫星ET... 截至收盘,中证卫星产业指数下跌3.2%,国证通用航空产业指数下跌1.4%。同花顺iFinD数据显示,...
激流:中国科技投资的势能与锚点... 8月,中国科技产业投资大会要来了。 进入2026年,中国科技投资的市场体感正在发生变化。 资金活跃度...
原创 刚... 刚传喜讯转头就被封杀,宇树科技这48小时的剧情,比好莱坞剧本还跌宕。一边是黄仁勋亲自在台上给H2 P...