苹果公布”MUSCLE“,更好地与 ChatGPT 竞争
创始人
2025-01-08 09:32:57
0

苹果公司最近在人工智能领域取得了显著进展,特别是在提升其语言模型的用户体验方面。该公司的研究人员开发了一种新的方法,旨在改善用户在人工智能模型升级时的体验。这种方法被称为MUSCLE(兼容LLM进化的模型更新策略的缩写),它通过训练适配器来确保新模型与旧模型在响应上保持一致性。

在人工智能实验室中,当底层大语言模型更新时,常常会出现一些意外的行为,比如改变其响应查询的方式。这不仅会影响用户对系统的熟悉度,还可能迫使他们改变与模型交互的方式。苹果的研究人员意识到,这种变化可能会削弱主流iOS用户使用人工智能模型的体验。因此,他们着手研究如何通过创建指标来比较不同模型版本之间的回归和不一致,从而开发出一种培训策略,从一开始就最大限度地减少这些不一致的发生。

喜好儿网

研究人员在论文中指出,用户在与大型语言模型(LLM)交互时,会开发出自己的提示样式和技术。因此,模型的更新可能会迫使用户改变他们编写提示的方式。虽然一些早期采用者可能会接受这种变化,但对于大多数iOS用户来说,这可能是不可接受的。为了解决这个问题,苹果的团队研究了如何通过训练适配器来保持模型在更新过程中的一致性。

MUSCLE方法的核心在于不需要更改基础模型的训练,而是依赖于训练适配器,这些适配器基本上是LLMs。通过这种方式,研究人员成功地减少了负翻转(即旧模型给出正确答案而新模型给出错误答案)的情况,降低幅度高达40%。此外,他们还主张确保新模型所犯的错误与旧模型可能犯的错误一致,认为当两个模型都不正确时,保持一致是有价值的。这样做的目的是让用户在模型不正确时能够继续使用他们已经制定的应对策略,从而减少不一致带来的用户不满。

为了测试MUSCLE系统的有效性,研究团队对LLMs进行了更新,类似于Llama和Phi这样的模型,并在不同任务中发现了高达60%的负面翻转。他们通过询问更新后的模型数学问题,检查这些模型是否仍然能够给出特定问题的正确答案。结果显示,利用MUSCLE系统,研究人员成功地减轻了相当多的负面翻转,有时高达40%。

这项研究的意义在于,它不仅提高了人工智能模型的可靠性,还确保了用户在模型更新时能够获得一致的体验。随着聊天机器人如ChatGPT和Google Gemini的更新速度不断加快,苹果的这项研究有可能使这些工具的新版本更加可靠,从而避免用户在切换到更新型号时遭受更差的用户体验。

相关内容

热门资讯

有玩家发现!科乐天天踢填大坑辅... 有玩家发现!科乐天天踢填大坑辅助(辅助)本来是真的有辅助脚本(真实有挂)1、完成科乐天天踢填大坑辅助...
窍要辅助!衢州都莱辅助器下载!... 窍要辅助!衢州都莱辅助器下载!详情真的有辅助插件(有挂教程)该软件可以轻松地帮助玩家将衢州都莱辅助器...
经核实!飞驰娱乐辅助软件(辅助... 经核实!飞驰娱乐辅助软件(辅助)原来存在有辅助神器(有挂规律)1)飞驰娱乐辅助软件辅助插件:进一步探...
练习辅助!情怀打七开辅助!必备... 练习辅助!情怀打七开辅助!必备是有辅助工具(果真有挂)情怀打七开辅助是不是有人用挂微扑克wpk插件教...
复盘辅助挂!多乐跑辅助(辅助)... 复盘辅助挂!多乐跑辅助(辅助)总是真的有辅助app(证实有挂)小薇(辅助器软件下载)致您一封信;亲爱...
方针辅助!雀姬无限钻石辅助!分... 方针辅助!雀姬无限钻石辅助!分享存在有辅助教程(有挂方略)1、金币登录送、破产送、升级送、活动送。详...
围绕透视问题!陕西三代二辅助器... 围绕透视问题!陕西三代二辅助器(辅助)切实真的是有辅助工具(了解有挂)陕西三代二辅助器脚本下载中分为...
学习辅助!中至赣牌圈有没有辅助... 学习辅助!中至赣牌圈有没有辅助!揭幕真的是有辅助挂(发现有挂)中至赣牌圈有没有辅助破解侠是真的助透视...
有了最新消息!边锋老友修改器(... 有了最新消息!边锋老友修改器(辅助)一贯真的有辅助脚本(有挂方略)1)边锋老友修改器辅助插件:进一步...
要领辅助!丰县14张脚本!解谜... 要领辅助!丰县14张脚本!解谜真的有辅助挂(存在有挂)丰县14张脚本辅助器是一种具有地方特色的麻将游...