智能推荐系统|火山云
‣
基本概念
项目(旧版): 项目是在智能推荐平台完成推荐服务的一条完整线路。主要用于管理一个推荐流程下的数据(测试+历史+增量)、特征、模型、服务流,方便用户更简单地使用平台。一个项目只能绑定一个行业模版和一个推荐类型。
应用(新版): 应用是在智能推荐平台完成推荐服务的一条完整线路。一个公司可能会有多个应用,应用主要用于管理一个推荐流程下的数据、特征、模型、在线服务,方便用户更简单地使用平台。一个应用只能绑定一个行业模版。
栏位: 栏位指的是推荐的位置集合,可以包含一个或者多个spm,栏位下需要配置一套在线服务的策略(包括召回策略、排序策略和业务规则)。
行业模版: 是平台预置的基于不同行业业务的推荐业务模板,也指客户应用推荐的实际行业领域。当前支持的行业类型为电商行业、内容行业(长视频、内容社区)。
推荐类型: 电商行业和内容行业目前支持“猜你喜欢”推荐类型,即根据用户兴趣,推荐给用户感兴趣的物品,达到“千人千面”的效果。后续将逐步拓展相关推荐、热门推荐、沉浸式推荐等推荐类型。
数据表: 包含用户表、商品表(或内容表,因行业而异)、行为表。
场景: 场景用于标识行为发生的位置,在平台上使用SPM来区分。以电商行业为例,SPM位置编码由A/B/C/D四段构成, 各分段分别代表 A:业务, B:页面, C:页面区块, D:区块内点位。段之间用$##$分隔,即A$##$B$##$C$##$D,详细传输规范参考行业数据模版。场景标识非常重要,数据校验报告、AB实验报告中均需要查看分场景(通常取spm前三段)的指标。
归因分析: 用于计算用户行为(例如电商行业的商品购买成功、长视频行业的视频播放等)的产生主要来源于前面哪些场景下的哪些行为。将整个时间线上的用户行为经过去重后,构建一个转化路径图。例如电商行业常见的归因路径:曝光-点击-加入购物车-下单-转化(购买成功)。
特征工程: 特征工程可以基于行业模板自动化处理,也可以自主开发。启用行业模板后,可基于业务目标,自动化完成从数据到样本的生成,包含特征预处理、特征抽取、样本生成等阶段。自主开发则可以更灵活地定义数据表、数据处理任务,灵活扩展特征及样本的定义。
策略管理: 包含召回策略及业务规则的管理。支持直接使用内置的召回策略/业务规则,也支持创建自定义召回策略/自定义业务规则。自定义召回策略,目前仅在私有化环境下支持“添加召回”;自定义业务规则目前支持 3 种,“自定义过滤”、“自定义重排”和“自定义返回字段”。
在线服务: 是指构建推荐引擎的服务流程,平台以可视化的方式呈现,支持对召回、排序(精排)、规则模块进行配置。通过构建可视化、可配置的在线服务,让用户可以更清晰地明确流程及对应环节的交互配置。
召回: 召回是推荐系统的关键问题之一,指从全量的商品集合中筛选出一定数量的符合用户需求的商品,并将商品提供给下游的“排序”环节。
排序: 该模块可以对“召回”的商品进行更精细的计算排序,返回特定数量的商品排序。
AB测试: 为了验证一个新策略的效果,准备原策略A和新策略B两种方案。 随后在总体用户中取出一小部分,将这部分用户完全随机地分在两个组中,使两组用户在统计角度无差别。将原策略A和新策略B分别展示给不同的用户组,一段时间后,结合统计方法分析数据,得到两种策略生效后指标的变化结果,并以此判断新策略B是否符合预期。上述过程即A/B实验。
Loading...