商品类目体系建设

343 阅读2分钟

搜索碰到的问题

电商搜索召回中除了文本相关性之外基本都要一些其他的辅助特征,比如本文将要介绍的Query-Cat相关性,举个例子:

Input:   “苹果”
CallBack:“苹果手机iPhone12 64GB”
          “红富士苹果 酸甜可口” 
origin_img_v2_390bd317-ad27-41ac-9aef-a15ed25bccbg.jpgorigin_img_v2_80c79f8b-e869-467b-bf59-4ac82577426g.jpg

**所以搜索在生活电商场景召回过程中会参照Query-Cat特征来优先召回水果品类商品,正在3C场景会优先召回电子电器类商品;**

当前解决方案

其实Cat类目在各家电商平台都是现有概念,比如多点内部有很多类目:

  • 采销类目:更倾向于采购需要;
  • 后台类目:方便运营同学管理商品分析;
  • 前台类目:方便在C端方便用户选择;

以上类目都有其特殊使用场景,作为搜索特征要么太粗要么太乱(非搜索特征维度),所以搜索需要构建一套自由类目体系-“营销类目”,模型集成商品标题、SEO、前后分类、属性词、图片、国条、品牌等数据完成训练,整体逻辑如下:

image.png

经过优化后一级品类预测正确率98%;工程小组整合经过线上系统验证,当前营销类目已经在搜索、推荐、榜单等场景使用,覆盖线上142W验证商品、超2300细分营销类目;

在营销类目预测准确性稳定后,算法同学继续发力衍生出商品中心词、商品属性词等,这些虚拟商品特征对搜索推荐召回商品准确性行提升较明显。

新问题

随着商品覆盖品类不断增加,算法同学维护营销类目、中心词、属性词模型投入越来越大,这个问题急待克服。