一种基于用户行为序列的搜索排序方法与流程

本发明属于互联网,具体为一种基于用户行为序列的搜索排序方法。
背景技术:
1、搜索排序是指在一次会话中,用户在交互界面输入需要查询的查询词,系统根据一定的算法和规则,返回给用户一个排好序的文档列表的过程。
2、搜索排序方法是指根据用户查询的关键词来对相关文档进行排序,以便用户能够迅速找到他们需要的信息,在信息检索领域,排序方法是非常重要的,因为它直接影响到搜索结果的质量和用户的满意度,在基于用户行为序列排序时,用户行为序列建模有多种范式,如:使用sum-pool ing的方式进行聚合,sum-pool ing的范式下的模型,结构简单,线上性能表现优异,在早期的实验中往往也能取得不错的效果,但是,这种方式建模不够细致,无法对行为序列中的物料进行差异化学习,无法区分每个物料的重要性程度,因此需要对其进行改进。
技术实现思路
1、本发明的目的在于提供一种基于用户行为序列的搜索排序方法,以解决上述背景技术中提出的问题。
2、为了实现上述目的,本发明提供如下技术方案:一种基于用户行为序列的搜索排序方法,具体步骤如下:
3、步骤一:
4、收集网站上用户曝光点击数据,包括用户行为序列和目标物品;
5、步骤二:
6、根据序列特征中每个元素对应的附属信息,构造对应的s ide informat ion序列;
7、步骤三:
8、计算序列中每个元素点击的时间戳与当前曝光物料的时间戳之间的小时差,生成点击序列对应的pos encoding序列;
9、步骤四:
10、将用户画像特征、用户行为序列、s ide information序列、pos encoding序列,物料特征(品牌、车系、价位等)、上下文特征,这些特征通过embedding层进行向量化;
11、步骤五:
12、使用s ide information序列、pos encoding序列与行为序列按embedding的维度拼接在一起,生成shape为[-1,seq_num,seq_len,k]的张量,其中seq_num为序列特征的个数;
13、步骤六:
14、将上一步生成的序列特征按第二个维度进行sum聚合,生成形状为[-1,seq_len,k]的张量,这个张量作为序列特征的表征输入到模型;
15、步骤七:
16、将候选物料s ide information特征拼接到一起,生成[-1,h,k]的张量,同样地,按第二维进行sum聚合,生成形状为[-1,k]的张量,这个张量作为候选物料的表征输入到模型;
17、步骤八:
18、计算候选物料embedding表征与用户行为序列的embedding表征之间的attention分数,然后通过softmax函数将得分转化为[0,1]之间的概率权重,表示用户行为与目标物品之间的相关性,再将注意力权重乘以其对应的用户行为表征,得到加权后的用户行为向量;
19、步骤九:
20、将加权后的用户行为向量与其他特征向量通过拼接的方式进行特征融合;
21、步骤十:
22、使用融合后的特征向量作为输入,通过多目标ple模型拟合ctr、ctcvr目标;
23、步骤十一:
24、根据模型输出的ctcvr分数对候选集物料进行排序。
25、优选地,步骤一中所述的用户行为序列是用户与系统互动的历史记录,例如点击、评分等。
26、优选地,步骤一中所述的目标物品是要进行推荐的物品。
27、优选地,步骤二中所述的每个元素对应的附属信息是指与用户行为序列中每个元素,如点击、评分等行为相关联的额外信息或元数据,这些附属信息通常包括但不限于物品的品牌、级别、国别、类型、价格范围等属性。
28、优选地,步骤四中所述的用户画像特征是指描述用户个人属性、偏好、行为模式等信息的集合,用户画像特征包括但不限于栏目偏好、活跃程度、浏览习惯等,上下文特征是指与当前推荐场景相关的环境信息,它描述了用户在进行推荐请求时所处的具体环境和条件,上下文特征包括但不限于时间、app站内频道等。
29、优选地,步骤五中所述在进行拼接之前,需要确保所有输入数据都经过了适当的预处理。
30、优选地,步骤五中所述通过将s ide information序列、pos encoding序列与行为序列按embedding的维度拼接在一起,从而能够对行为序列特征进行了“加宽”处理,使得每个行为元素现在不仅包含了其本身的信息还附带了与该行为相关的附属信息。
31、优选地,步骤七中所述h代表物料对应的s ide information特征个数。
32、优选地,步骤八中所述将attention权重与对应的用户行为表征相乘时,要确保权重与表征的维度一致。
33、本发明的有益效果如下:
34、本方案提供了一种高效计算attention的方法,并增强了模型对候选物料的泛化能力,在实际生产场景中表现优异,其基于步骤二到步骤八利用s ide informat ion和posencoding,在一定程度上增加了序列特征的信息容量,增强模型的泛化能力,对于近期的行为物料给予多的权重,差异化各个物料时效性,其中步骤八不同于self-attention计算方法,大幅度降低attention计算的复杂度,使模型在互联网推荐场景具有更好的性能,同时在效果方面也有明显的提升,在深度学习可解释性方面也有更加友好,集中关注候选物品,它通过计算用户行为序列中每个元素与目标物品之间的关联性权重,将注意力更加集中在与目标物品相关的行为上,根据每个用户和目标物品之间的关联性权重,动态地分配注意力,通过不同的权重分配,可以突出显示与目标物品最相关的行为,从而更好地理解用户的意图和偏好,综上所述,本方案具有大规模个性化推荐、动态权重分配特性,在行为序列建模方面,其具备灵活性,可作为一个模块插入到现有的模型中,从而灵活地适应不同的推荐场景和任务需求。
技术特征:
1.一种基于用户行为序列的搜索排序方法,其特征在于:具体步骤如下:
2.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤一中所述的用户行为序列是用户与系统互动的历史记录,例如点击、评分等。
3.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤一中所述的目标物品是要进行推荐的物品。
4.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤二中所述的每个元素对应的附属信息是指与用户行为序列中每个元素,如点击、评分等行为相关联的额外信息或元数据,这些附属信息通常包括但不限于物品的品牌、级别、国别、类型、价格范围等属性。
5.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤四中所述的用户画像特征是指描述用户个人属性、偏好、行为模式等信息的集合,用户画像特征包括但不限于栏目偏好、活跃程度、浏览习惯等,上下文特征是指与当前推荐场景相关的环境信息,它描述了用户在进行推荐请求时所处的具体环境和条件,上下文特征包括但不限于时间、app站内频道等。
6.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤五中所述在进行拼接之前,需要确保所有输入数据都经过了适当的预处理。
7.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤五中所述通过将side information序列、pos encoding序列与行为序列按embedding的维度拼接在一起,从而能够对行为序列特征进行了“加宽”处理,使得每个行为元素现在不仅包含了其本身的信息还附带了与该行为相关的附属信息。
8.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤七中所述h代表物料对应的side information特征个数。
9.根据权利要求1所述的一种基于用户行为序列的搜索排序方法,其特征在于:步骤八中所述将attention权重与对应的用户行为表征相乘时,要确保权重与表征的维度一致。
技术总结
本发明属于互联网技术领域,且公开了一种基于用户行为序列的搜索排序方法,具体步骤如下:步骤一:收集网站上用户曝光点击数据,包括用户行为序列和目标物品。本方案提供了一种高效计算Attention的方法,并增强了模型对候选物料的泛化能力,在实际生产场景中表现优异,其基于步骤二到步骤八利用s ide information和pos encoding,在一定程度上增加了序列特征的信息容量,增强模型的泛化能力,对于近期的行为物料给予多的权重,差异化各个物料时效性,其中步骤八不同于self‑attention计算方法,大幅度降低attent ion计算的复杂度,使模型在互联网推荐场景具有更好的性能,同时在效果方面也有明显的提升,在深度学习可解释性方面也有更加友好。
技术研发人员:马震,林熙耀,郑勃举
受保护的技术使用者:车智互联(北京)科技有限公司
技术研发日:
技术公布日:2024/11/18
技术研发人员:马震,林熙耀,郑勃举
技术所有人:车智互联(北京)科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
