💡 站外导读:在信息过载的时代,传统推荐系统常陷入“预测-排序”的级联瓶颈,难以捕捉用户的动态兴趣与上下文连贯性。行业亟需突破性技术来提升用户粘性与商业转化。快手最新发布的OneRec系统,正瞄准这一核心痛点,它将推荐任务重构为端到端的序列生成过程,利用先进的生成式AI架构,直接生成个性化推荐列表,从而更深刻地理解用户意图,驱动平台核心指标全面增长。
OneRec是什么
OneRec 是快手推出的新型端到端生成式推荐系统。采用编码器-解码器架构,通过稀疏 Mixture-of-Experts(MoE)技术提升模型容量,保持高效的计算性能。与传统级联推荐系统不同,OneRec 使用会话式生成方法,能生成上下文连贯的推荐结果,通过迭代偏好对齐模块结合直接偏好优化(DPO),进一步提升推荐质量。在训练过程中,OneRec 将多模态表征量化为 token 序列输入模型,采用两阶段训练策略:先进行基础的 item 预测任务训练,再通过 DPO 进行偏好对齐。

OneRec的主要功能
-
端到端生成式架构:OneRec 采用编码器-解码器架构,将推荐问题转化为序列生成任务。编码器整合用户的历史行为序列,解码器通过稀疏混合专家(MoE)架构逐步生成用户可能感兴趣的视频。
-
会话式生成方法:与传统的逐点预测不同,OneRec 提出会话式生成方法,能生成整个推荐列表,更好地捕捉上下文信息。
-
实验验证与效果提升:OneRec 在快手平台的在线 A/B 测试中实现了 1.6% 的观看时间提升,显著优于传统方法。
OneRec的技术原理
-
编码器-解码器架构:neRec 采用 Encoder-Decoder 架构,将推荐问题转化为序列生成任务。编码器负责将用户的全生命周期行为序列压缩成兴趣向量,解码器则通过稀疏混合专家(MoE)架构逐步生成用户可能感兴趣的视频。能更好地捕捉用户兴趣的变化,并生成连贯的推荐列表。
-
多模态分词器:OneRec 首创了协同感知的多模态分词方案,融合视频的标题、标签、语音转文字、图像识别等多维信息,转化为分层的语义 ID。能更精准地建模用户兴趣。
-
强化学习偏好对齐:OneRec 引入了基于奖励机制的偏好对齐方法,通过强化学习增强模型效果。模型利用偏好奖励、格式奖励和业务奖励构建综合奖励系统,优化生成结果。能使模型更好地感知用户的细粒度偏好,提升推荐的精准度。
-
性能优化:OneRec 通过架构重构,将关键算子数量大幅压缩,通过稀疏 MoE 架构扩展模型容量,显著提升了计算效率。通过训练和推理优化,实现了更高的模型浮点运算利用率(MFU),使得算力效率大幅提升。
OneRec的项目地址
- arXiv技术论文:https://export.arxiv.org/pdf/2502.18965
OneRec的应用场景
- 短视频推荐:OneRec 在快手的短视频推荐主场景中表现突出,承担了约 25% 的请求(QPS)。通过生成式架构和强化学习偏好对齐,OneRec 在用户停留时长、点赞、关注、评论等交互指标上均取得了显著提升。
- 本地生活服务:OneRec 在快手的本地生活服务场景中也取得了显著成效。AB 对比实验表明,推动了交易总额(GMV)增长 21.01%,订单量提升 17.89%,购买用户数增长 18.58%,新客获取效率提升了 23.02%。
- 直播内容匹配:OneRec 被应用于直播内容匹配,通过动态生成推荐序列,能更好地匹配用户的实时兴趣,提升用户在直播场景中的参与度和互动率。
- 广告投放:在广告投放领域,OneRec 的生成式架构能根据用户的兴趣和行为动态生成广告推荐,提高广告的精准度和转化率。
📝 站长洞察 (Editor’s Insight)
OneRec的发布标志着推荐系统从“判别式”范式向“生成式”范式的战略性跃迁。它不仅仅是一个工程优化,更是对推荐本质的重新思考:推荐不再是给候选集打分,而是像对话一样为用户“创造”一个连续的兴趣流。其融合的稀疏MoE、多模态分词和DPO偏好对齐,精准踩中了当前大模型落地的三大关键——效率、多模态与价值对齐。快手将其在25%的线上流量中验证,并撬动了本地生活等核心商业场景的显著增长,这为行业树立了新标杆:生成式AI正在从“玩具”变为重塑业务逻辑的“引擎”。未来,谁能将生成能力与用户微观意图更深度耦合,谁就能在下一代互联网竞争中占据制高点。
