终于,清华快手养出了通人性的AI!
创始人
2026-05-30 02:24:47
0

新智元报道

【新智元导读】当推荐算法行业步入深度深耕阶段,行业发展全新增长突破口在哪里?

多年来,短视频推荐系统在协同过滤、序列推荐、多目标优化等方向上经历了多轮技术迭代。

伴随现有技术体系日渐完善,通过模型结构优化、常规特征开发、可观测目标学习带来的效能提升逐步放缓,行业亟需开辟创新研究思路。

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验: 视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。

实验尝试利用大模型的模拟和推理能力,将社会学和心理学领域中的价值观理论引入推荐排序策略,并在快手主站进行了大规模随机在线对比实验。

初步结果显示,这一方向不仅技术上可行,更在用户使用APP时长、电商、直播、社交、搜索等多个业务维度上实现了同步正向增长,创新性且系统性地实现了推荐系统在社会价值观层面上通过算法手段满足用户需求的功能。

技术路径

如何将抽象的价值观概念从理论落地到推荐系统,是本项目需要解决的核心问题之一。

团队基于前期合作的产出[1],分两个阶段完成了 视频价值的大模型推理 和 轻量蒸馏模型线上生效 的完整解决方案,将离线实验验证的方法论转化为真实推荐系统的策略工具。

图1–ValueOpt技术框架

大语言模型推理

团队利用大语言模型模拟短视频受众群体,推理不同类型用户在观看视频后的行为和心理变化,进而推断用户所能感知到的价值观,大致方案沿用前期工作[1]。

完整的大模型推理流程针对部分随机采样视频进行,采样视频时间跨度为6个月,视频量累计超过650万条,基本覆盖全部类目。

轻量蒸馏上线+策略对比试验

为了应对每天数以千万计的视频理解需要,团队进一步完成了蒸馏模型规模化部署

模型以快手自研的视频embedding为特征,以大模型推理结果为监督信号,训练轻量级蒸馏模型,将大模型强大的受众模拟和价值观推理能力迁移到可实时在线高通量服务的小模型中,实现对全量视频的价值观标签预估,从而具备多场景规模化应用的能力。

离线测试发现蒸馏小模型在充分训练后可以达到85%以上准确率,人工评测也认为其与大模型推理结果无明显差异,满足线上落地需求。

视频价值标签预估结果在线上推荐系统生效时,存在另一个关键挑战,即视频价值与用户可观测反馈关联的不可预知性

虽然前期离线实验已验证视频价值推理结果能够有效提升视频排序的准确率,但线上真实场景中用户存在多种反馈信号(APP时长、点赞、关注、打赏、长期留存),目前也并没有任何理论论证这些反馈信号与视频价值的相关性和互补性。

此外,团队也认为不同推荐业务场景下由于其作者生态和消费者群体不同,其价值内容也会呈现明显差异,因此只有通过完整的线上对比试验才能准确判断系统隐藏的价值需求和短板。

线上落地实验

实验设计:亿级用户规模验证

  • 实验在快手主站精选页的重排阶段进行,采用经典A/B实验范式

  • 实验规模:每组约5%流量,每组覆盖千万级用户群体

  • 实验周期:AA期观察一周,AB实验持续进行超过一个月

  • 实验干预:每个实验组,在重排阶段,适度提升某一类价值观视频的分发权重,观察对各业务指标的影响

    初步结果:多业务板块同步增长

    这是本研究最值得关注的发现——价值观调控能够拉动多个业务维度,且不同价值与多业务指标关联存在差异。

    • 内容消费:个人安全组,显著提升了用户APP使用时长及留存指标。

    • 直播业务:多个价值观组别(个人安全、传统、仁慈-关怀等)对直播送礼金额有显著正向影响。

    • 电商业务:享乐主义、个人安全、社会安全等价值观组别对大盘结算GMV有明显正向贡献,买家数也呈现同步增长。

    • 社交互动:多个价值观组别显著提升了双关用户的内容互动与分享行为,平台社交活跃度有所改善。

    • 主动搜索:大多数实验组均显著提升了用户主动搜索次数,其中刺激类价值观视频的提升幅度最为突出。

      拓展讨论和未来方向

      为什么有效?一点理论解读

      这一系列结果背后,有两个值得深思的发现。

      其一,供需平衡需求。原有的推荐分发策略以主题作为内容的主要表征维度,视频的价值观属性在分发过程中并未被显式考量。

      这意味着,某些价值观类型的视频,在平台上的供给比例可能长期低于用户的潜在需求——当我们主动提升这类内容的分发权重,用户的正向反馈便随之而来。

      其二,价值观的行为驱动力。本研究在全体用户层面统一提升某类价值观视频的曝光比例。实验结果表明,特定价值观维度的内容在大盘层面更容易激发用户的观看、互动与转化行为。

      这一发现也具有一定的理论意义:它将社会心理学中成熟的价值观理论与推荐系统的内容理解问题连接起来,同时也为价值观理论本身提供了新的经验证据——在数字内容消费这一大规模真实场景下,不同价值观类型对人类行为的影响存在因果性、系统性差异,这是以往依赖问卷或小样本实验的价值观研究所难以探讨的问题。

      意义与展望

      这些发现的意义在于:人类的行为选择背后,往往由深层价值观驱动。不同价值观类型的内容,在激发用户消费、互动与转化行为上存在系统性差异。

      相关内容

      热门资讯

      网易智企举办2026网易创新企... 5月29日,网易智企联合英特尔在杭州良渚举办“智行合一·2026网易创新企业大会”。大会聚焦AI A...
      现货黄金一度大跌2%,接近失守... 3月23日消息,现货黄金日内跌幅一度扩大至2%,最低报4403.78美元/盎司。(广角观察)
      首批基金2025年年报出炉:基... 3月23日消息,首批基金2025年年报出炉,机构持仓路线图浮现。近日,中邮基金率先披露了旗下基金的2...
      现货白银亚太早盘涨超2%,现货... 3月23日消息,周一亚太早盘,现货黄金、现货白银低开高走。现货白银一度涨超2%,最高报69.56美元...
      25家券商持牌入场,碳金融业务... 3月23日消息,在政策引导、市场扩容与行业转型三重因素共同推动下,3月以来,券商布局碳金融提速,长江...
      三结太阳能电池光电转化效率达3... 3月23日消息,瑞士科学家在最新出版的《自然》杂志刊发研究报告称,他们巧妙融合钙钛矿与硅材料,打造出...
      5月进入厄尔尼诺状态,今夏气候... 今天(29日),记者从中国气象局新闻发布会上了解到,5月赤道中东太平洋海温进入厄尔尼诺状态,夏秋季将...
      暴雨是如何形成的? 暴雨究竟从何而来?形成过程是什么样?象象带你解锁气象知识,一起来学习吧! 来源:中国气象局
      人工智能和能源加速“双向奔赴” 新华社北京5月29日电 题:人工智能和能源加速“双向奔赴” 新华社记者王悦阳 中国石油“昆仑”大模型...