从结构化搜索到学习排序与检索的演进

用户576110558132

2025-07-29 59 阅读2分钟

检索与排序的多层架构

现代搜索应用、广告平台和推荐系统普遍采用包含候选检索（从百万级条目中筛选数百个）和候选排序（精细化调整展示顺序）的多层信息检索架构。亚马逊音乐通过学习排序（LTR）模型优化top-k结果，该模型融合查询信号、用户偏好等特征进行训练。

静态检索的局限性

传统检索模型（如全文搜索、结构化搜索）依赖静态策略，无法利用用户反馈动态调整。即使BM25评分函数和元数据扩展能提升相关性，但若最佳候选未被检索到，排序模型将失效。神经检索模型（如基于BERT的向量搜索）虽能捕捉语义，仍面临冷启动问题。

学习排序与检索（LTR&R）方案

我们提出LTR&R架构，通过上下文多臂老虎机（Contextual MAB）实现检索阶段的强化学习：

策略优化：平衡已知策略的利用（提高精度）与新策略的探索（提升召回率）
特征工程：
- 查询特征：语言类型、意图分类、历史行为
- 动作特征：相似度分数、实体类型、检索源类型
动态混合：如图播客搜索结果所示，语义策略更适合主题搜索，而词法策略擅长实体搜索

实际挑战与解决方案

音乐搜索中，模糊查询（如"love"）需处理多类别实体（歌曲/艺术家/播客）和复合属性（如"Taylor Swift"跨流行/乡村流派）。传统静态查询计划难以应对，而LTR&R通过以下方式突破：

建立记忆索引：记录查询-实体(Q2E)交互得分
减少人工规则依赖：自动学习最优策略组合
最小化遗憾：在延迟约束下最大化用户行为奖励

架构优势

LTR&R相比传统系统能：

简化搜索系统设计
提升模糊查询的召回率
通过反事实数据持续优化
适应动态内容库（如新增音乐流派）

该框架已应用于亚马逊音乐，为未来搜索系统提供可扩展的机器学习解决方案。