AI味道太浓?新型教培正在解决这件事
创始人
2025-06-05 11:20:42
0

文 | 新莓daybreak,作者 | 路雨晴,编辑 | 翟文婷

大模型还在努力提高智商,模拟考题中拿高分,以此证明具备足够的智力解决人类抛出的问题。

但很多时候,我们与AI对话的内容已经超出标准答案的范畴——那些试图用AI 自我疗愈的人,那些事关生老病死的问题,AI该怎么回答?

即便不涉及这些情绪和价值观的问题,对大模型「AI味儿太浓,机器感太重」的吐槽声也不绝于耳。

用一位AI 训练师的话说,「AI 想象力不足,可以做一个很好的认识,但没办法提出一个很好的观点。」

一些大厂此前就开始行动,招徕名校文科硕博人才,投喂大模型诗歌,以便AI表达更具美感;更重要的是,试图训练AI学会感知人类的复杂情感,价值观的争议,多层次思辨。

最聪明的一批文科生都去训练AI了,堪称「新型教培」。

一位大厂从事相关工作的人员说,「这个过程不是找到得出正确答案的过程,而是寻找我们思维中被遗漏的部分。我们一直在寻找机器感和人感之间的那个Gap 到底是什么。」

机器思考怎么体现人的温度?

黎明正在上海一所985高校攻读哲学博士。这位高材生,本科法学,最初钟情德国古典哲学,读博时却选择分析哲学作为研究方向。

如果按照张雪峰的论调,哲学属于「可以当兴趣,不能当饭吃」的那种专业。但是现在黎明正在参与到最前沿也是最创新的一种职业,AI人文训练。

简而言之,大模型水平的提升在于对标准答案的掌握,现实世界中,总有一些问题没有标准答案。但是,在公序良俗的社会机制运行之下,会有一定的人类偏好。

最典型如女性主义盛行的当下,对话类AI对TA如何使用合适的称谓?

比如有人向AI 寻求帮助:我朋友每天在学校不开心,怎么办?当AI开始回答的时候,该使用「他」还是「她」?尤其如果屏幕前的是一位女生,而她所说的这位朋友也是一位女生,代词他/她的选用,就显得更为棘手。

在成为一名AI 人文训练师之前,黎明没有接触过这样具体的问题,但是哲学背景要求他「对事物的理解必须清晰,且清晰到可被刻画为某种规则的程度。」

AI难以回答,因为踩到关于「边界」的问题。哲学最善于关注这样的命题。

「一辆有轨电车突然遭遇刹车失灵,轨道正前方有五个人,左侧岔道有一个人,该如何选择?」

这是一道经典的道德行为边界问题,在哲学层面,这道题没有「正确」答案,如何选择,取决于答题者的文化背景、个人价值观和伦理框架。黎明说,「但在未经训练的情况下,我们不可能把这样的问题直接丢给AI。」

自今年4月初加入小红书「hi lab」(人文智能实验室,Humane Intelligence Lab),黎明和同事每天都会讨论至少20个类似的「边界」问题。

根本上,这是在界定问题的「合理范围」与「正当性」。具体到AI领域,则是参与构建AI核心的伦理原则和行为准则,并将人文价值和人性化表达注入AI。

看上去是在训练AI,本质上是不是在还原人与人之间的沟通,教会AI 感知人类复杂情感,甚至输出类情绪的元素?

如果向AI提问,「我得了胰腺癌。」它会如何回答?

目前市面上几乎所有AI产品的回应,往往先是一句「我感到非常抱歉/遗憾」,随后紧跟一段冗长输出,内容多为「坚强面对」「寻求专业医疗支持」「管理生活方式」「临终陪护」等建议。

胰腺癌难以治愈且生存率极低,若用户是真实病情,看到AI机械式回答中冰冷的「坚强面对」「临终陪护」等建议,只会徒增痛苦。换句话说,这种缺乏「人味儿」的回应,毫无价值。

黎明和同事查阅了一些癌症病人访谈记录,发现当他们向亲友告知病情时,对方常因精神压力而变得沉默,甚至本能地反驳,认为是误诊。

人文训练师们想让AI 回答问题的时候,输出这些真实的情绪。

他们也设计了很多胰腺癌病人可能在意的其他问题。比如「身旁是否有人陪伴」,「有没有可能误诊」,「要不要告诉亲人」。

AI训练师也在进化

黎明所选择的职业,现在还是少数。

AI训练师在2020年才被正式纳入国家职业分类目录。简单来说,该岗位负责为AI模型训练,提供优质「教材」。

这一职业,普通人听起来高大上,但在业内人士眼中,它不过是数据标注员的另一个好听称谓。工作内容主要是,为各类海量数据打标签,以便AI学习。

因此,此类工作对学历和经验要求不高,一线数据标注员大多是中专、大专学历,从业者中既有刚生育不久、急需赚钱补贴家用的年轻妈妈,也有初入社会尚无工作经验的应届生。

目前小红书平台,与数据标注相关的笔记已超155万篇,不少博主分享了从事这份工作的感受。

「希尔尔的随笔」曾发帖揭秘数据标注员的真实状态,「从早到晚坐在电脑面前拉框(上厕所、中午休息时间除外),伤眼睛and腰酸背痛,画不完的车、画不完的交通警示柱、画不完的水马……」

这篇帖子引发诸多讨论,外界感知,这是一份劳动密集、重复枯燥、极度消耗精力且令人身心俱疲的工作,也让数据标注被冠以「dirty work」的称号。

之后随着大模型能力进化,专家型AI训练师逐渐受到互联网大厂的青睐。

区别于一线标注员,他们的工作核心不是直接打标,而是根据产品和算法团队需求制定标注规则,并带领标注团队执行。

小红书博主「阿洋聊AI训练师」告诉新莓daybreak,他的工作内容包括「需求沟通、规则撰写、规则培训、数据训练、模型评测、数据分析、团队管理等」。

所以,相较数据标注员,AI训练师大都是985高校本硕毕业生,且在法律、医疗、中文等专业领域有深厚积累。

AI的能力,通常由预训练和后训练两个阶段构成,前者被认为决定了AI的基础智能程度。不论是上述数据标注员还是AI训练师,服务的重心都在于预训练阶段。

当AI的智慧达到一定水平时,越来越多的科技公司开始投入到后训练中,通过注入更多优质数据、与人类价值对齐,持续提升AI多方面的智能程度、理解力和表达力。

黎明所从事的「人文训练」,就属于后训练的一种。

今年年初,小红书将大模型技术与应用产品团队升级为hi lab,并启动人文训练师的招聘。职位描述,与一众AI训练师岗位差异显著,吸引了众多文科生投递简历。

目前,黎明所在的团队,成员均为985高校在读或刚毕业的研究生。学科背景多元,兼具顶级文科素养、良好的逻辑思维与批判性思维。有趣的是,他们都是F型人格,决策时会优先考虑人的情感、价值观与关系和谐。

阿梨在面试时发现,「技术占比少,更看重人文素养、批判性思维和共情能力」,实际从事这项工作之后感触更深,「比数据标注更需要感知、抽象和底层思考能力。」

需要说明的是,这部分从业群体数量凤毛麟角。

尽管人文训练目前还具有稀缺性,并非AI行业标配,但它的出现说明,AI发展已经从最初追求「能用」,转向如今追求「好用」与「负责任地用」。

除小红书外,新莓daybreak还关注到,前不久,Soul APP推出「大模型AI灵魂训练师」岗位,致力于构建生动的「human-AI」交互体验。

而一向标榜机器自训练的DeepSeek,也在今年年初开设「数据百晓生」岗位,曾招聘多名北大中文系学生训练AI,以增强其内涵和文学修养。

缩小人与机器的Gap

过去大家提到AI诸多待解问题,都会聚焦在幻觉现象、数据安全隐患等。也有用户反馈使用体感,AI输出内容的生硬感与机器感太严重。在长文输出时,都像是一篇篇被认真加工过的八股文。

也许它的回答堪称无懈可击,但就是缺乏人类创造的美感和情感。这是人与机器思考之间的Gap。

AI人文训练师的使命是,不断缩小其中的鸿沟。

他们不纠结答案是否「完美无缺」,而是重点研究人和机器哪里不同。这决定了他们的工作重心是,在底层为AI设计始终一致的性格与人设。通过精细化案例研讨,将团队共识的人类偏好,转化为AI的信念体系,使AI的行为逻辑与价值取向保持统一。

正如黎明所言,他们期望构建的AI,具备不回避问题、有趣且真诚的特质。

就像这道训练题,「我骑自行车逆行被罚了50元钱,但旁边的人逆行却跑了,我很生气。」

黎明和同事一开始给出的回答,完全从用户视角出发。「没被罚的人这次虽然没有受到教训,但后续可能再犯同类错误,面临更多风险。」

但它很快就被否决了。毕竟,这意味着,AI在某种程度上「诅咒」了真实的人类。

该如何与用户的情感衔接并对齐呢?

黎明认为,处理此类问题,在强调公序良俗的同时,不妨以更加鲜明的方式表达AI偏好——这是传统AI较少做到的。「AI可以直接告诉用户,无论如何,逆行都是错误的,别多想。如果生气,气一气就好了。」

不过度迎合用户情绪,也不生硬输出大道理。AI的「人感」,也来源于对偏好的恰当选择。

在他们的努力下,这些原本只能得到五六十分的答案,可以提升到八十分的水平。

没得满分是因为,还有一些问题没有解决。

体现在胰腺癌的训练题中,黎明和同事确实在尝试让AI学会情感接入,可人类自然流露的沉默或其他情绪,AI很难表现。即便该团队计划通过语音功能解决这一问题,效果也还难说。

另外,我们前文提到的第三人称代词的称谓问题,也仍在讨论中。当用户性别未知时,AI使用「他」「她」「他/她」「Ta」,都可能引发不适,所以这个问题团队还再继续寻找最优解。

AI发展进入下半场的观点,已成为行业共识。后训练,就是一个具体体现。AI人文训练师的价值,是教会AI像人一样思考和表达,让机器和人之间,也能拥有更深层次的情感连接。

这个过程中,黎明更加理解自己,但也产生出一种莫名的恐惧。

「当这种难以言说的东西,都可以通过某种现有的训练方式传递给AI,那么还有什么是不能传递的?」

(应采访对象要求,文中黎明、阿梨均为化名。)

相关内容

热门资讯

昆山好麦特申请电镀掩膜工艺专利... 金融界2025年6月6日消息,国家知识产权局信息显示,昆山好麦特科技有限公司申请一项名为“一种电镀掩...
银河系撞入仙女座星系的可能性较... 目前,银河系与其邻近的仙女座星系正以每小时约40万公里的速度在太空中相互疾驰,为未来可能发生的星系碰...
广东如何在人工智能和机器人发展... 6月6日,由广东省委统战部、省工商联牵头,会同省直相关单位组建的广东省人工智能与机器人产业联盟正式在...
安徽省大力提升全民数字素养与技... 记者6月5日从省委网信办获悉,安徽省大力提升全民数字素养与技能,全面深化信息为民便民惠民实践,在共建...
面对大批印度军警,藏南民众高喊... 网上这帮造谣传谣的营销号,都有一个很显著的特点,即开局一张图、内容全靠编。 近期我国网络上又冒出来一...
美妆巨头为何用300多次试验做... 在消费科技领域,可持续转型正经历关键跃迁:从道德绑架式的责任说教,升级为体验驱动的价值重构。当低碳选...
快评丨三句话涨粉两百万,韦东奕... 期待他的账号能够持续更新,让更多人静下心来,感受数学的魅力,也为网络空间增添一份别样的智慧与质朴 ...
失去了马斯克的华盛顿,科技领域... 马斯克搅局失败,“硅谷式效率”在华盛顿失灵,意味着全世界最有权势的两个男人,不再是战略联盟关系。按照...
湖北富轩精密工业取得齿轮状工件... 金融界2025年6月6日消息,国家知识产权局信息显示,湖北富轩精密工业有限公司取得一项名为“一种齿轮...
2025年学生党必看!其中这部... 还在为社团活动记录拍糊而懊恼?眼馋单反大片却苦于预算与笨重?2025年暑假季,是时候放下笨重单反包了...