智能UI:1688 B买狂欢节的探索与实践

avatar
阿里巴巴 前端委员会智能化小组 @阿里巴巴

文/  阿里 CBU技术部 - 霸天

前言

商品的个性化推荐为业务带来了非常显著的增量,但是随着海量的商品数量的上线,商品的数据化信息的激增。基于个性化搜推过滤依旧有非常多的商品信息需要用户进行决策,在一定程度上“过多的决策“会带来用户的“流失”。所以非常需要通过智能UI(UI的个性化)来缩短用户的“购物决策时间”,在可用的空间中为用户展示他最关心的内容,为业务带来更多的增长可能。

痛点&解决思路

这两年,阿里内很多的BU都开始了智能场景的探索,阿里内部也启动了共建方向,2019年和2020年智能化都是前端委员会探索方向,CBU也积极参与其中,并且和集团在做智能UI的同学保持长期的交流和共建,从19年开始探索智能UI。2020年3月大促通过算法的UI个性化推荐,取得了PVctr环比12%的增长。同时通过智能UI的产品化链路的建设,沉淀了CBU的智能UI组件物料库,和《CBU智能UI对接最佳实践》。

基于算法的智能UI推荐(信息差异和UI视觉差异),在集团多个BU(淘系,CBU,蚂蚁,口碑)的实践中都取得了非常不错的成绩,平均为业务带来的PVctr环比提升均在10%+。但是在持续的日常和商人节的智能UI的探索中,我们也发现了一些问题。

  1. 算法冷启动:算法的UI推荐模型,需要进行冷启动训练。
  2. 依赖大流量:流量小的场景,在训练不足的情况也会存在PVctr下降的情况
  3. 模型无法复用:真实投放的场景十分复杂,“人货场“中的任何一个因素的变化都会干扰训练。场景访问的人群不同,跨业务的物料组件通常也会不同,算法的UI推荐模型不能被复用,需要重新训练。
  4. 探索门槛高:很多找我们交流对接的BU会因为没有算法同学的支持,而放弃了智能UI的探索。

我们开始反思,在智能化之前,我们是否还需要进行专业化的沉淀。重新审视智能UI,“通过基于用户的UI偏好进行算法的动态定投,从而为业务带来增长”。用户的UI偏好是一个非常复杂的问题,随着物料的变多,UI方案的笛卡尔积组合就需要非常大的训练量。在直接“千人千面”前,我们需要一轮千人N面。

基于UI的数字化,结合用户的画像分析,我们在CBU12月的商人节中,探索出一条稳健的智能UI实践策略。通过UI动态人群定投,我们不再需要冷启动,不在依赖大流量场景,也解决了模型无法复用的问题。在这次12月商人节我们实现了UI智能的同时,沉淀了智能合图以及UI快速干预&调整能力,带来总体的PVctr环比提升10.27%,智慧货盘场景PVctr提升15.77%,价格敏感&金融敏感别环比提升 14.21%14.63%

以下是我们本次大促活动中方案思考和技术架构,分享给大家。

策略解读

结合B类的业务特色以及买家的人群画像,我们先进行一层人群画像的收敛,再基于收敛进行AB实验。在实现动态定投的同时,还能通过后续的归因来细化人群偏好。(例如,我们为价格敏感人群设置了48种UI方案,再在价格敏感人群种进行这48种方案的AB,细化价格敏感人群的不同物料偏好)具体的实现和对接需要经历以下5个步骤。

  • 拆分人群画像
  • 物料的开发&拼装
  • 方法打标
  • UI&人群推荐
  • 数据分析&归因

用户偏好建模

基于1688大市场的用户行为归因,通过算法的分类模型,进行多维度用户偏好建模,实现用户画像的清洗。同时剔除覆盖度不够的人群画像,用相应的物料组合来承接不同的人群的UI偏好。我们将人群拆分为行为偏好(价格偏好、服务偏好、利益点偏好、产地偏好、金融偏好、其他:没有命中偏好的人群)和商品偏好(新品、趋势品、爆品、其他:没有命中商品的人群)两大维度进行组合。

用户偏好本质上是期望通过用户的自然属性以及平台行为推测出用户的兴趣重点,进而给用户推荐满足他们兴趣的物品|信息|场景等。(以下是我们人群建模的详细方案)


本次算法在利用多维度用户个性行为的基础上,深度结合用户精细化群组(身份/地域/等级)分类下的群体化偏好信息,解决了用户个体行为稀疏,偏好标签覆盖率不高,用户需求认知不足的问题。进行用户商品偏好,服务偏好,金融偏好价格偏好、利益点偏好以及产地偏好六大维度的建模。

第一步:个体行为偏好建模 个体行为偏好建模核心是将用户在平台上的多维行为信息总结抽象为具体的偏好分值,针对六大维度的偏好我们分别建立独立的二分类模型。不同维度的偏好建模流程与方法基本一致,主要分为问题定义,样本构建,特征工程,label设定,模型选型以及指标衡量等步骤,下面对其中的核心步骤进行简述。

  • 问题定义:这里我们将用户对某类标签的偏好建模抽象为:利用用户历史N-90天的平台行为,去预测用户未来N天对挂有某类标签的商品是否会产生“行为”。

  • 特征工程:特征层面上目前我们主要利用了用户在平台上的不同时间的组合行为(1天,7天,30天,90天),行为主要包括如下:

    1. 货盘行为:即用户对带有相应特征商品的点击,加购,收藏等行为
    2. 文本类行为:搜索词,旺旺聊天记录
    3. 标签行为:信息的曝光|点击
    4. 页面动线:用户在各类心智场景的行为,如火拼场景对应低价心智,新品tab对应新品心智等
    5. 特色行为:基于业务理解挖掘到的用户行为与用户偏好潜在mapping关系,比如高频多次的商品转发或多收货地址代表着用户有一件代发需求等。
  • label设定: 用户未来一天对包含该标签的商品的行为达到一定阈值后,则该项标签的偏好label为1。用户的行为会按照不同程度进行加权,例如点击权重为1,收藏权重为2,购买权重为8。产地,服务等6项偏好标签,样本label置为1的条件相同。

在这样的 label 的设置中我们也发现一些问题,有金融偏好和服务偏好的人群比例过高,与常识不符合。仔细分析商品标签可以看到能够挂上金融标签的商品占比xx.x%,比例非常大,标签能够覆盖的商品占比越高,有该偏好的用户就占比就越大,最后导致商品数量的大小直接决定了偏好人群的大小,这显然是不符合常理的。那如何修正呢?



基于标签背后的心智,差异化标签置1的门槛,严肃打标标准。改善由于挂标商品分布不均而导致的数据偏差。这样做也有他的缺点,(引入人为业务理解,数据分布可能随着人的专业知识认知变化而变化)。但是在这种场景下,这样的方案相对合理,现行label设定规则如下:

  1. 行为过包含该标签(商品,价格,产地,营销 )的商品达到一定阈值或用户搜索query包含(低价,新品)等信息后则该项偏好label为1;
  2. 服务偏好label置1条件 :(商品转发次数 >= 阈值) 或 (收货地址数 >= 阈值) 或 (产生代销/分销订单) 或 (搜索端点选过相应筛选项) 或 (行为过包含该标签的商品达到一定阈值,且占比大于商品标签占比)则该项偏好label1
  3. 金融偏好label置1条件 :(命中诚e赊准入条件人群,且 使用了诚e赊,融易收支付) 或( 行为过包含该标签的商品达到一定阈值,且占比大于商品标签占比) 则该项偏好label为1
  • 模型选型: GBDT二分类模型。

第二步:群体偏好建模 区别于C类用户,B类用户的行为稀疏度非常高,但是我们发现,某些具有特定社会身份的C类人群,他们会有相对一致的偏好,可以作为冷启动的有效手段,如宝妈偏好母婴用品,年轻女孩偏好美妆等。B类用户由于他们背后的生意模式是比较相似的,因此可以通过类似群体性的聚合实现信息茧房的突破,一定程度上完成用户偏好的冷启动。群体画像构建分为两个步骤:

  • 人群划分,我们认为同一人群具有相似的偏好,这里结合业务输入选取“身份地域等级”作为细分人群组合粒度;
  • 群体偏好计算,计算细分人群与大盘人群之间的TGI指数= [目标群体中具有某一特征的群体所占比例/大盘中具有相同特征的群体所占比例]*标准数100,获取群体偏好得分。例如:(东北L0微商价格敏感人数占比)/(大盘价格敏感人数占比)。分数越大说明该细分群体对该项标签越偏好。

从以下热力图我们也可以简单的看到淘卖微商服务偏好更敏感,一件代发需求强烈;实体店都偏好低价格段;微商对新品最敏感;用户对本地区的卖家有偏好等等,与我们的业务认知比较符合。


第三步:群体偏好与个体偏好融合: 由于不同用户其平台行为的丰富程度是不一样的。对于行为丰富的用户,我们选择更相信其个人行为而产生的偏好。而对于那些行为比较稀疏的用户,其个人行为置信度比较低,我们会更加倾向于利用其群体化的偏好进行冷启动。


   



第四步:用户偏好归一化 由于同一用户不同偏好之间的偏好分是基于独立模型建模得到的,不同分数之间不能横向对比。这里我们第一版本采取了对每一维偏好纵向上进行百分位归一化的方法,保障单一用户各偏好分均代表其在大盘人群中的百分比排名情况,横向拉齐各项偏好指标。(例如:A用户原始的服务偏好分为0.78,大盘总人数为2000W人,所有用户在服务偏好上的分数按从小到大排序后,A用户原始的服务偏好分排名第1000W名,则A用户的归一化服务偏好分=1000W/2000W=0.5)

后续算法侧进一步利用多标签学习的方法,进行用户标签一致性建模,从根源上去解决用户偏好标签基本都是单任务模型,且各标签开发的业务背景、owner、模型选项各有不同,对数据的理解和质量要求也参差不齐,导致从宏观层面分析和应用时,单用户各标签之间横向不可比的问题。相关ATA敬请期待,如果对人群建模进一步了解。

偏好消费

通过将人群拆分为行为偏好(价格偏好、服务偏好、利益点偏好、产地偏好、金融偏好)和商品偏好(新品、趋势品、爆品)两大维度进行组合。从行为偏好来确定用户专属的会场结构,再结合用户商品偏好商品模型混排放大用户偏好的商品属性。

确定用户的一级偏好 基于用户的行为偏好,我们通过对物料的颜色深浅,线条处理,信息结构等设计,来突出和弱化物料的信息。针对下方价格敏感人群,我们可以通过折线和胶囊视觉来突出价格的要素。同理针对利益点敏感产地敏感等人群,通过重点突出利益点和产地的信息,弱化价格等其他信息。为每种偏好人群关联的物料至少准备2中以上强化信息和弱化信息的物料。(ps:左上角的标签用于标示商品是属于哪种生命周期的商品,便于理解)


结合商品属性确定用户的二级偏好 进一步结合用户对商品的属性偏好,人群进行 UI下钻 ,设计出更丰富的UI组合。通过对用户偏好的商品属性放大,引导他在海量的商品feeds流中发现自己关注的商品的属性。例如爆品偏好的人群,在商品推荐流中可能会被推荐各种商品(新品,爆品,趋势品,尾货等等),但是我们只放大爆品的爆品属性,例如: “热卖xx件”和“社交爆款”等来捕获用户的视觉焦点,在整个feeds流中就可以减少用户对爆品的决策。


(例如:一个用户被识别为价格敏感人群,我们首先通过折线物料来突出降价。再进一步,识别用户偏好的商品心智,如果用户是爆品敏感,我们就在feeds流中,将爆品商品展示“热卖xx件”的物料。)


通过两级人群偏好(A行为偏好xB商品偏好)的定投,我们为15种画像的人群提供定制化的UI,同时通过投放数据的归因,得到更细粒度的用户对偏好数据,为下一次设计做指导。

所以当你是(价格敏感且爆品敏感)或(产地敏感且爆品敏感)的人群,看到真实线上方案是这样的~


物料开发

确定完具体的实验策略,就进入到物料生产阶段。通过lowcode的物料开发方式,实现物料的一次开发多次复用。同时将UI拆分成布局物料进行灵活拼装,12月商人节通过24个物料和3种布局,我们实现了线上同时348种方案的个性化定投。具体步骤如下(详细细节之前分享过,此处不再扩展)

  1. 首先通过上传sketch,快速解析物料
  2. 绑定数据源发布
  3. 配置实验组合
  4. 对接算法策略和消费容器组件
  5. 智能UI上线

 


UI 数字化

从原来的算法冷启动,变为基于UI数字化的人群定投。在对接链路上,多了一层物料&方案的打标,和标签消费的环节。那算法如何消费物料呢?

通过打标进行UI收敛,算法消费UI标签进行人群偏好匹配。维护标签库来进行物料和方案的数字化,我们将标签分为“内容标签”,“类型标签” 和 “整体的方案标签”。(内容标签代表物料是什么内容,类型标签代表了物料的心智,样式效果等。整体方案标签则能从UI总体突出要素来标记UI方案的整体心智)


当然,不同的物料也可以打上相同的标签。(例如:标题物料,样式一致但业务字段不同,开发的同学可能开发了2个长得一样的物料。或则:在商品心智标签中,“热卖xxx人“ 和 “xxx人已加购”都代表了相同的爆款的心智)

通过对方案上线后的数据回流,实现跨业务的算法结论的复用。同时通过对物料标签进行了归因,能为UED提供设计指导服务。设计的同学可以通过选择人群或则输入userId的方式,查看用户偏好的内容标签排序和视觉设计排序(这部分在12月大促中还未实现,后续会进行产品化)

每个BU都可以基于自己的业务特征对物料和方案配置标签库。下面是CBU现在使用的标签库。通过方案标签实现先验的UI定投,再通过物料标签实现后验的归因,为设计提供指导。


同样也可以通过为方案打上黑名单来自动化处理不合理方案过滤,我们建设了通用的标签库和打标的能力。


实验分桶

通过对UI方案的打标,我们将UI方案分为(价格敏感,服务敏感,利益点敏感,金融敏感,产地敏感,黑名单)x(新品,趋势品,爆品)。剔除黑名单后进行分桶实验,为了确保实验的准确性和误差,我们分为基础桶,随机桶,以及人群定投实验桶。

  1. A组基础桶,切10%的流量,(基础桶的确定逻辑,由业务指定必出的字段和必出的业务逻辑)
  2. B组随机桶,切10%的流量,(所有上线的UI方案进行随机投放)
  3. C组实验桶,切80%的流量,(基于人群定投所有的个性化UI方案)

实验效果

这次投放了大促会场xx%+,覆盖智慧货盘xx万个,实现无人搭建的效率提升的同时,通过UI定投为业务带来了 PVctr 环比 10.27% 的总体提升。在实验过程中我们对智能UI的样式进行了一版的迭代,通过快速替换物料的方式快速上线新UI方案,在智慧货盘的智能UI方案中,我们带来了PVctr 环比 15.77% 的提升。


产品化建设

12月商人节我们探索出了很多的新能力,但是产品化的建设还需要进一步的优化,建设思路和项目进展,分享给大家。基于人群的UI定投,需要涉及的内容比较多。中间涉及了先验的人群分析,物料开发及公共组件的沉淀,方案打标,实验分桶,UI推荐,实验归因等环节。

  1. 画像分析:通过提前对大市场的用户进行精细化的拆分,清洗出用户行为偏好画像。
  2. 开发打标:基于用户的行为偏好画像进行UI设计开发,为实验投放方案进行打标。
  3. 实验分桶:通过基础桶,随机桶,实验桶的方式控制实验变量和干扰。
  4. UI 推荐:算法通过将人群和UI进行匹配,精准的为用户投放UI。
  5. 实验归因:更细粒度的进行人群和UI偏好的归因,数据回流支持下一次人群定投实验。

S2建设比较核心的功能在与打标服务和UI推荐服务,下面会进行扩展讲解。

打标服务

前端与算法按照约定消费UI方案,将UI方案拆分为区块与物料的方式进行灵活拼装,通过id来记录物料,通过字母来记录布局区块,通过固定协议的字符串来特指UI方案(例如:A^320|B^2425C^2371|.......)。

通过打标关系表来链接物料方案与标签的关系,整体的UI标签结合CBU的人群画像进行UI定投,物料标签结合线上数据回流归因实现设计实践的方法论沉淀实现UI推荐。


UI推荐服务

其中UI推荐服务,通过配置鲸幂id来确定场景的物料和布局方式,对接人群服务和商品服务,识别用户的两级偏好,结合商品属性进行用户偏好放大。实践充分验证了UI智能化之前的专业化必要。除了这次的算法人群画像外,我们后续还会对接CBU的买家运营平台,把UI运营的能力开放给业务,进行UI推荐服务的升级。


这次大促沉淀的UI策略已经在CBU日常的A+级别大促中延用,后续我们会为业务提供UI运营的能力,通过配置的方式,业务可以自行维护标签库和AB人群偏好,来精细化干预UI的人群匹配关系。(A:锁定场景的基础心智,B:结合商品混排放大UI匹配规则)。

运营同学可以通过写SQL的方式进行人群圈选,同时为方案打上相应的标签来进行UI匹配。运营的人群视角也能够给算法带来更细粒度的画像输入。(开放的配置能力建设中)


沉淀CBU物料中心,为设计的同学提供设计指导服务,设计的同学可以选择不同的人群来查看不同的物料标签在场景的点击效能。也可以看线上页面的人群与现有的人群画像的覆盖度,进一步指导场景UI实验策略的设计(建设中)


归因小站

为业务提供通用的数据归因能力,业务同学通过自主的实验投放,借助我们平台来查看实验数据,基于3种分桶的总体的PVctr的提升,以及不同人群画像的下钻数据,和行业数据,进行UI的实时调整和修改


总结

智能UI我们完成了最佳实践的探索,沉淀了物料的低代码研发,托管,实验配置及消费能力。这次大促我们实现了基于人群的UI探索探索,接下来我们还会进行智能UI工程链路的优化,算法UI推荐和UI精细化运营并驱进行。以下是我们目前的项目进度。

  1. 基础通用组件沉淀(完毕)
  2. 打标能力,批量打标服务开发(完毕)
  3. CBU的物料收敛,大促&日常物料库收敛(完毕)
  4. 统一业务域(会场与搜索推荐)的UI推荐服务,(技术方案对焦中)
  5. 2.0 数据归因平台的(建设中)
  6. UED设计指导平台(建设中)

未来规划

场景智能

CBU目前除了智能UI,还在做智能搭建的探索。从“智慧货盘生产” 到 “会场结构智能” 到 “组件UI智能”,实现会场的“智能化精细化运营”。智慧会场在12月大促中也取得了非常不错的效果,未来在搭建侧,我们能解放前端的生产力,用户能实时获得个性化的信息推荐。


UI精细化运营

另一方面,接下来我们依旧会进行“买家UI精细化运营”的重点建设,除了年轻的个性化的用户诉求,智能UI也会重点支持场景适老化,沉淀适老化的场景物料,为老年群体提供更棒的购物体验。(中国已经进入了老龄化的社会,现在中国已经有2.5亿的老年人,但是其中只有1.2亿使用了互联网。很多老年人是互联网的“局外人”。记忆力、注意力以及感知能力的衰退,带来了视力障碍,在交互界面上他们有更强的“个性化诉求更强”) **


关于智能UI,我们相信一定是未来的趋势。通过借助算法的能力和运营经验的沉淀,通过精细化买家UI运营,更加智能的为我们的用户定制专属场景,未来也很有可能会颠覆前端的开发和工作模式。结合“端智能”和“买家互动”,我们能为前端智能化提供更好的性能和体验。前端智能化,未来也一定还有更多的机会和领域值得探索。

另外我们是阿里1688部门,正在急招前端,方便你了解下我们这个可爱的前端团队zhuanlan.zhihu.com/p/99483714,欢迎大家一起来交流,微信号 白霸天(linlin--1028)。



除文章外还有更多的团队内容等你解锁🔓