文章指出电商商品推荐常有误,提出基于张量的排名可解决。传统系统难以整合多信号,而张量能将多维信号实时统一评估,实现更精准的商品发现。
译自:Why online stores keep showing the wrong products — and why tensors fix it
作者:Tim Young
如果我搜索“冬季黑色跑鞋”,marksandspencer.com 给我找到了一双漂亮的系带靴……竟然是女款。在过去的六个月里,我下了30个订单,购买了45件商品,其中只有一件来自女装部——一双给我母亲的拖鞋。所以,这里有一个重要的信号被忽视了。或者 M&S 对我的了解比我自己还要多。
公平地说,现代商品发现比看起来要复杂得多。一个发现系统必须评估许多信号,以确定哪些商品应该优先展示。它可能会考虑关键词匹配、与购物者查询的语义相似性、点击和购买行为、库存可用性、促销活动以及浏览历史等个性化信号。商品属性,如类别、品牌、价格和评分,也可能影响排名。
因此,商品发现不仅仅是从商品目录中检索商品。它关乎共同评估多个信号以确定相关性。现代商品发现已有效演变为一个多维排名问题,其中必须同时评估数十个信号以确定哪些商品首先出现。
什么是基于张量的排名?
在商品发现的背景下,基于张量的排名指的是在多维结构中同时表示和评估多个相关性信号的排名模型。这些信号可能包括
- 来自向量搜索的语义嵌入
- 结构化商品属性,如品牌、价格或类别
- 购物者行为信号,如点击和购买
- 上下文信息,如季节性或促销活动
- 业务优先级,如利润或商品销售规则
通过将这些信号表示为张量,排名模型可以直接评估它们的交互,而不是通过单独的排名阶段进行处理。这种方法使发现系统能够更精确地建模相关性,反映了真实世界商业环境的复杂性。
传统排名的局限性
许多电商搜索平台最初是为早期一代的在线零售而设计的。排名策略通常依赖于关键词匹配结合相对简单的规则。随着时间的推移,这些系统上增加了额外的信号。引入了点击率和转化率等行为信号。增加了商品销售规则以推广某些商品。最近,语义嵌入已被用于支持向量搜索和自然语言查询。
尽管这些增加改进了发现能力,但也使排名模型变得更加复杂。现代发现系统必须结合结构化属性、机器学习信号、嵌入、上下文信息和业务优先级。
在许多架构中,这些信号通过独立的管道进行处理。检索可能发生在搜索引擎中,模型推理发生在另一个系统中,最终排名则在另一个阶段。随着排名模型变得越来越复杂,这些管道可能变得难以管理并引入额外的延迟。
商品发现中的向量与张量
向量搜索已成为现代商品发现中的一项重要能力,使系统能够基于语义相似性匹配商品。通过将查询和商品表示为嵌入,向量搜索可以检索与购物者请求概念相关的商品,即使确切的关键词不匹配。
然而,向量只是张量的一个子集。它们是表示空间中一个点的一维单位。而张量是多维的,并保留其维度之间的关系。
| 结构 | 维度 | 示例 | |
| 标量 | 0 | 价格(一个测量值) | price = $175 |
| 向量 | 1 | 商品嵌入(一个对象的属性) | shoe = [price, rating, popularity] |
| 矩阵 | 2 | 商品目录表(多个对象) | products × attributes |
| 张量 | N | 多信号排名(多维信号) | product × user × signals × time |
当用户搜索“跑鞋”之类的商品时,没有唯一的“正确”答案。你可能希望展示文本相关度最高的商品,利润最高的商品,有库存的商品,或者最有可能转化为购买的商品(针对特定用户)。这些都是有效的信号,但决定哪个应该排在第一位并不简单。
这些信号常常相互冲突。最相关的商品可能缺货,最有利可图的选项可能不符合购物者的意图,而最个性化的结果可能与当前的促销活动不符。实际上,相关性是一个决策问题,需要实时地共同评估多个信号。
传统的向量数据库在这里显得不足。它们旨在根据嵌入检索相似商品,但不能在单个排名决策中结合和平衡更广泛的信号集。
基于张量的排名模型通过允许所有这些信号在一个单一的排名函数中一起评估来扩展这种方法。嵌入、商品属性、用户行为和业务上下文都为最终得分做出贡献,从而推动更受控和更具适应性的排名决策。
为什么搜索平台需要内置张量支持
用张量表示相关性信号只是故事的一部分。对于现代商业系统,排名模型还必须在查询时高效评估。许多搜索架构通过外部管道处理机器学习排名。检索发生在搜索引擎中,候选结果被发送到单独的系统进行模型推理,然后返回结果进行重新排名。虽然这种方法可行,但它会引入额外的延迟和操作复杂性。
出于这个原因,张量支持应该直接内置到发现平台中。当排名模型作为查询管道的一部分在搜索引擎内部进行评估时,发现系统可以将嵌入、结构化属性、行为信号和业务上下文组合成一个实时执行的单一模型。
这种架构允许复杂的排名模型运行,同时保持高流量商业环境所需的低延迟。它还简化了实验,使团队能够在不引入额外基础设施的情况下发展排名策略。
由于商业环境不断变化,包括价格更新、库存波动以及促销活动的开始和结束,在查询时直接评估这些信号可确保发现结果反映当前的业务状况。
评估支持基于张量排名的商品发现平台
在评估现代商品发现平台时,有几个架构能力变得很重要:
-
原生张量支持
平台应直接在排名模型中支持张量表示。 -
引擎内模型评估
排名模型应在搜索引擎内部进行评估,而不是通过外部推理管道。 -
实时特征评估
库存、价格和行为数据等信号应在查询时合并。 -
多模态信号支持
平台应在一个统一的排名函数中结合嵌入、结构化属性和行为信号。 -
大规模低延迟排名
复杂的排名模型必须在高流量商业系统的延迟要求内运行。
支持这些能力的平台更适合现代商品发现的多维特性。
展望未来
商品发现已经远远超出了简单的关键词搜索。今天的发现系统必须理解购物者意图、解释商品目录数据、整合行为信号,并响应快速变化的业务状况。
满足这些要求需要能够实时共同评估多个信号的排名架构。基于张量的排名模型提供了一种实现方式,使发现系统能够表示和评估现代商业环境中相关性的多维特性。
希望,能让我快速找到我想要的“冬季黑色跑鞋”。