AI味道太浓？新型教培正在解决这件事_科技资讯

AI味道太浓？新型教培正在解决这件事

创始人

2025-06-05 11:20:42

0次

文 | 新莓daybreak，作者 | 路雨晴，编辑 | 翟文婷

大模型还在努力提高智商，模拟考题中拿高分，以此证明具备足够的智力解决人类抛出的问题。

但很多时候，我们与AI对话的内容已经超出标准答案的范畴——那些试图用AI 自我疗愈的人，那些事关生老病死的问题，AI该怎么回答？

即便不涉及这些情绪和价值观的问题，对大模型「AI味儿太浓，机器感太重」的吐槽声也不绝于耳。

用一位AI 训练师的话说，「AI 想象力不足，可以做一个很好的认识，但没办法提出一个很好的观点。」

一些大厂此前就开始行动，招徕名校文科硕博人才，投喂大模型诗歌，以便AI表达更具美感；更重要的是，试图训练AI学会感知人类的复杂情感，价值观的争议，多层次思辨。

最聪明的一批文科生都去训练AI了，堪称「新型教培」。

一位大厂从事相关工作的人员说，「这个过程不是找到得出正确答案的过程，而是寻找我们思维中被遗漏的部分。我们一直在寻找机器感和人感之间的那个Gap 到底是什么。」

机器思考怎么体现人的温度？

黎明正在上海一所985高校攻读哲学博士。这位高材生，本科法学，最初钟情德国古典哲学，读博时却选择分析哲学作为研究方向。

如果按照张雪峰的论调，哲学属于「可以当兴趣，不能当饭吃」的那种专业。但是现在黎明正在参与到最前沿也是最创新的一种职业，AI人文训练。

简而言之，大模型水平的提升在于对标准答案的掌握，现实世界中，总有一些问题没有标准答案。但是，在公序良俗的社会机制运行之下，会有一定的人类偏好。

最典型如女性主义盛行的当下，对话类AI对TA如何使用合适的称谓？

比如有人向AI 寻求帮助：我朋友每天在学校不开心，怎么办？当AI开始回答的时候，该使用「他」还是「她」？尤其如果屏幕前的是一位女生，而她所说的这位朋友也是一位女生，代词他/她的选用，就显得更为棘手。

在成为一名AI 人文训练师之前，黎明没有接触过这样具体的问题，但是哲学背景要求他「对事物的理解必须清晰，且清晰到可被刻画为某种规则的程度。」

AI难以回答，因为踩到关于「边界」的问题。哲学最善于关注这样的命题。

「一辆有轨电车突然遭遇刹车失灵，轨道正前方有五个人，左侧岔道有一个人，该如何选择？」

这是一道经典的道德行为边界问题，在哲学层面，这道题没有「正确」答案，如何选择，取决于答题者的文化背景、个人价值观和伦理框架。黎明说，「但在未经训练的情况下，我们不可能把这样的问题直接丢给AI。」

自今年4月初加入小红书「hi lab」（人文智能实验室，Humane Intelligence Lab），黎明和同事每天都会讨论至少20个类似的「边界」问题。

根本上，这是在界定问题的「合理范围」与「正当性」。具体到AI领域，则是参与构建AI核心的伦理原则和行为准则，并将人文价值和人性化表达注入AI。

看上去是在训练AI，本质上是不是在还原人与人之间的沟通，教会AI 感知人类复杂情感，甚至输出类情绪的元素？

如果向AI提问，「我得了胰腺癌。」它会如何回答？

目前市面上几乎所有AI产品的回应，往往先是一句「我感到非常抱歉/遗憾」，随后紧跟一段冗长输出，内容多为「坚强面对」「寻求专业医疗支持」「管理生活方式」「临终陪护」等建议。

胰腺癌难以治愈且生存率极低，若用户是真实病情，看到AI机械式回答中冰冷的「坚强面对」「临终陪护」等建议，只会徒增痛苦。换句话说，这种缺乏「人味儿」的回应，毫无价值。

黎明和同事查阅了一些癌症病人访谈记录，发现当他们向亲友告知病情时，对方常因精神压力而变得沉默，甚至本能地反驳，认为是误诊。

人文训练师们想让AI 回答问题的时候，输出这些真实的情绪。

他们也设计了很多胰腺癌病人可能在意的其他问题。比如「身旁是否有人陪伴」，「有没有可能误诊」，「要不要告诉亲人」。

AI训练师也在进化

黎明所选择的职业，现在还是少数。

AI训练师在2020年才被正式纳入国家职业分类目录。简单来说，该岗位负责为AI模型训练，提供优质「教材」。

这一职业，普通人听起来高大上，但在业内人士眼中，它不过是数据标注员的另一个好听称谓。工作内容主要是，为各类海量数据打标签，以便AI学习。

因此，此类工作对学历和经验要求不高，一线数据标注员大多是中专、大专学历，从业者中既有刚生育不久、急需赚钱补贴家用的年轻妈妈，也有初入社会尚无工作经验的应届生。

目前小红书平台，与数据标注相关的笔记已超155万篇，不少博主分享了从事这份工作的感受。

「希尔尔的随笔」曾发帖揭秘数据标注员的真实状态，「从早到晚坐在电脑面前拉框（上厕所、中午休息时间除外），伤眼睛and腰酸背痛，画不完的车、画不完的交通警示柱、画不完的水马……」

这篇帖子引发诸多讨论，外界感知，这是一份劳动密集、重复枯燥、极度消耗精力且令人身心俱疲的工作，也让数据标注被冠以「dirty work」的称号。

之后随着大模型能力进化，专家型AI训练师逐渐受到互联网大厂的青睐。

区别于一线标注员，他们的工作核心不是直接打标，而是根据产品和算法团队需求制定标注规则，并带领标注团队执行。

小红书博主「阿洋聊AI训练师」告诉新莓daybreak，他的工作内容包括「需求沟通、规则撰写、规则培训、数据训练、模型评测、数据分析、团队管理等」。

所以，相较数据标注员，AI训练师大都是985高校本硕毕业生，且在法律、医疗、中文等专业领域有深厚积累。

AI的能力，通常由预训练和后训练两个阶段构成，前者被认为决定了AI的基础智能程度。不论是上述数据标注员还是AI训练师，服务的重心都在于预训练阶段。

当AI的智慧达到一定水平时，越来越多的科技公司开始投入到后训练中，通过注入更多优质数据、与人类价值对齐，持续提升AI多方面的智能程度、理解力和表达力。

黎明所从事的「人文训练」，就属于后训练的一种。

今年年初，小红书将大模型技术与应用产品团队升级为hi lab，并启动人文训练师的招聘。职位描述，与一众AI训练师岗位差异显著，吸引了众多文科生投递简历。

目前，黎明所在的团队，成员均为985高校在读或刚毕业的研究生。学科背景多元，兼具顶级文科素养、良好的逻辑思维与批判性思维。有趣的是，他们都是F型人格，决策时会优先考虑人的情感、价值观与关系和谐。

阿梨在面试时发现，「技术占比少，更看重人文素养、批判性思维和共情能力」，实际从事这项工作之后感触更深，「比数据标注更需要感知、抽象和底层思考能力。」

需要说明的是，这部分从业群体数量凤毛麟角。

尽管人文训练目前还具有稀缺性，并非AI行业标配，但它的出现说明，AI发展已经从最初追求「能用」，转向如今追求「好用」与「负责任地用」。

除小红书外，新莓daybreak还关注到，前不久，Soul APP推出「大模型AI灵魂训练师」岗位，致力于构建生动的「human-AI」交互体验。

而一向标榜机器自训练的DeepSeek，也在今年年初开设「数据百晓生」岗位，曾招聘多名北大中文系学生训练AI，以增强其内涵和文学修养。

缩小人与机器的Gap

过去大家提到AI诸多待解问题，都会聚焦在幻觉现象、数据安全隐患等。也有用户反馈使用体感，AI输出内容的生硬感与机器感太严重。在长文输出时，都像是一篇篇被认真加工过的八股文。

也许它的回答堪称无懈可击，但就是缺乏人类创造的美感和情感。这是人与机器思考之间的Gap。

AI人文训练师的使命是，不断缩小其中的鸿沟。

他们不纠结答案是否「完美无缺」，而是重点研究人和机器哪里不同。这决定了他们的工作重心是，在底层为AI设计始终一致的性格与人设。通过精细化案例研讨，将团队共识的人类偏好，转化为AI的信念体系，使AI的行为逻辑与价值取向保持统一。

正如黎明所言，他们期望构建的AI，具备不回避问题、有趣且真诚的特质。

就像这道训练题，「我骑自行车逆行被罚了50元钱，但旁边的人逆行却跑了，我很生气。」

黎明和同事一开始给出的回答，完全从用户视角出发。「没被罚的人这次虽然没有受到教训，但后续可能再犯同类错误，面临更多风险。」

但它很快就被否决了。毕竟，这意味着，AI在某种程度上「诅咒」了真实的人类。

该如何与用户的情感衔接并对齐呢？

黎明认为，处理此类问题，在强调公序良俗的同时，不妨以更加鲜明的方式表达AI偏好——这是传统AI较少做到的。「AI可以直接告诉用户，无论如何，逆行都是错误的，别多想。如果生气，气一气就好了。」

不过度迎合用户情绪，也不生硬输出大道理。AI的「人感」，也来源于对偏好的恰当选择。

在他们的努力下，这些原本只能得到五六十分的答案，可以提升到八十分的水平。

没得满分是因为，还有一些问题没有解决。

体现在胰腺癌的训练题中，黎明和同事确实在尝试让AI学会情感接入，可人类自然流露的沉默或其他情绪，AI很难表现。即便该团队计划通过语音功能解决这一问题，效果也还难说。

另外，我们前文提到的第三人称代词的称谓问题，也仍在讨论中。当用户性别未知时，AI使用「他」「她」「他/她」「Ta」，都可能引发不适，所以这个问题团队还再继续寻找最优解。

AI发展进入下半场的观点，已成为行业共识。后训练，就是一个具体体现。AI人文训练师的价值，是教会AI像人一样思考和表达，让机器和人之间，也能拥有更深层次的情感连接。

这个过程中，黎明更加理解自己，但也产生出一种莫名的恐惧。

「当这种难以言说的东西，都可以通过某种现有的训练方式传递给AI，那么还有什么是不能传递的？」

（应采访对象要求，文中黎明、阿梨均为化名。）

上一篇：新股前瞻|阴极铜“吃香”，金浔股份扩产为何卡在“钱”关？

下一篇：今日重大通报!wpk外挂被实锤(透视)竟然真的有挂(有挂方法)-哔哩哔哩

AI味道太浓？新型教培正在解决这件事

相关内容

热门资讯