首页  专利技术  电子电路装置的制造及其应用技术

一种基于图神经网络的用户浏览事件分析预测方法

2026-03-24 11:20:02 211次浏览
一种基于图神经网络的用户浏览事件分析预测方法

本发明涉及图神经网络事件分析预测领域,特别是涉及用户浏览事件分析预测方法。


背景技术:

1、图神经网络的事件关联分析预测模型能够从历史事件数据中学习事件之间的潜在联系,并基于这些联系对未来事件进行预测。首先将历史事件数据转换成图结构,每个事件节点通常由一系列特征来描述,将这些特征转换为特征向量作为节点的属性输入到gnn模型中。最后通过邻居聚合收集其邻居节点的信息包括特征向量边信息等和聚合函数来将信息合并得到节点的表示更新,即不断从邻居节点学习的过程。为了捕获更深层次的信息,通常还会堆叠多个聚合和更新层,来捕获更广范围的邻居信息。

2、综上所述,现有用户浏览事件分析预测方法存在如下缺点:

3、1)没有更深层次的考虑浏览事件之间的潜在关联关系对用户浏览事件的影响,会造成对浏览事件预测的干扰;

4、2)用户的社交关系也会影响用户的浏览数据,不同的用户有着不同的影响因子,对其社交网也会有不同的传播力,从而导致不同的用户对其他用户浏览数据的影响有着差异。

5、上述现有技术存在的缺点会影响用户浏览事件预测的结果,使其无法更加准确的预测用户的浏览趋势,给用户体验带来了很大的压力。所以本发明提出了一种基于图神经网络的用户浏览事件分析预测方法。


技术实现思路

1、本发明要解决的技术问题是如何通过融合图神经网络和频繁模式挖掘技术,提高用户浏览事件分析预测的准确性。

2、为实现上述目的本发明采用以下技术方案:

3、本发明提供了一种基于图神经网络的用户浏览事件分析预测方法,包括以下步骤:

4、步骤1:获取用户浏览历史事件特征数据,并对用户浏览历史事件特征数据进行清洗、预处理;

5、步骤2:将预处理后的用户浏览历史事件特征数据输入到fp-growth频繁模式挖掘算法中,并输入支持度、长度指标信息进行频繁用户浏览事件序列挖掘,得到频繁用户浏览事件序列信息;

6、步骤3:图神经网络的基础上,结合事件用户信息、频繁用户浏览事件序列信息完成用户浏览事件分析预测。

7、上述方法中,步骤s1包括以下步骤:

8、步骤1.1、选择用户浏览事件的核心特征,包括商家信息、用户信息、用户浏览信息;

9、步骤1.1.1、确定商家信息特征,包括商家id、商家名称、地理位置、类别;

10、步骤1.1.2、确定用户信息特征,包括用户id、用户标识符、用户好友列表、用户粉丝数;

11、步骤1.1.3、确定用户浏览信息特征,包括浏览标识符、用户标识符、商家标识符。

12、步骤1.2、对用户浏览数据进行清洗、预处理,包括去除无效数据、重复值,合并数据源,使用时间滑动窗口分割时间段序列。

13、步骤1.2.1、去除无效的浏览数据,处理缺失值,检查用户id和商家id是否存在,移除不存在的无效数据;

14、步骤1.2.2、去掉重复值,保留用户对同一商家唯一时间的访问记录;

15、步骤1.2.3、合并用户信息数据、商家信息数据、用户浏览数据;

16、步骤1.2.4、使用时间滑动窗口的方法分割不同的时间段序列,得到最终的用户浏览事件特征数据。

17、上述方法中,步骤2包括以下步骤:

18、步骤2.1、创建fp字典树并初始化头指针表,构建辅助数据结构trie;

19、步骤1.1、创建根节点,标记树的起点;

20、步骤1.2、初始化头指针表,存储每个项最频繁出现的实例节点;

21、步骤1.3、对头指针表节点信息进行map映射,用于更新节点支持度时的快速定位;

22、步骤1.4、构建辅助数据结构字典树trie,保存每个节点的前缀信息;

23、步骤1.5、使用map记录fp字典树中每个节点的起始位置,实现快速定位;

24、步骤2.2、从fp前缀树提取频繁项,生成条件模式基,递归构建条件树挖掘频繁模式;

25、步骤2.2.1、从fp前缀树快速提取频繁项,

26、步骤2.2.2、以频繁项为根节点,生成条件模式基,条件模式基包括所有包含该频繁项的序列的子序列;

27、步骤2.2.3、将子序列剩余部分添加到条件树,作为频繁项的子节点,每个频繁项都与其相关的子序列连接起来,形成条件树的结构;

28、步骤2.2.4、递归构建条件树,挖掘所有频繁用户浏览事件序列模式。

29、步骤2.3、处理新增数据库d′,计算项支持度,重新排序,匹配缓存,构建新序列;

30、步骤2.3.1、计算d′中新的用户浏览序列的项支持度;

31、步骤2.3.2、按支持度重新排序用户浏览序列;

32、步骤2.3.3、将d′中每个项集的首项与缓存中的前缀序列进行匹配,如果缓存中存在与当前序列匹配的结果,则跳过该用户浏览序列;否则,将其保存到临时数据库td中;

33、步骤2.3.4、统计序列在临时数据库td中的支持度,去除小于阈值的项,得到处理后的新序列newlist;

34、步骤2.3.5、从缓存取出前缀序列集合curlist,与newlist匹配比较,找到最匹配的序列;

35、步骤2.3.6、使用kmp算法匹配表思路,提高序列比较效率。

36、步骤2.4、得到最匹配的前缀序列后,从前缀序列不匹配的节点处进行重新构建,得到新的条件模式基,对新的条件模式基构建条件模式树递归进行挖掘得到新的频繁模式序列,得到频繁用户浏览事件序列信息。

37、上述方法中,步骤3包括以下步骤:

38、步骤3.1、基于用户的社交特征学习,构建用户社交网络并使用图神经网络获取用户特征表示;

39、步骤3.1.1、构建用户社交网络,确定每个用户的初始被关注数fi和初始影响因子定义如下:

40、

41、步骤3.1.2、利用随机游走模型计算用户的影响因子

42、步骤3.1.3、使用图卷积神经网络更新用户节点的特征表示,包括信息聚合和特征转换两个阶段;

43、步骤3.1.4、根据公式计算用户节点v在第l+1层的特征表示公式如下:

44、

45、其中n(v)表示用户节点v的邻居节点集合,du和dv分别表示用户节点u和v的度,wl是第l层的可学习权重矩阵,表示第l层节点u的特征表示,σ(.)是非线性激活函数;

46、在图卷积神经网络模型训练完成之后,在图卷积神经网络的输出层中节点的特征表示即为基于用户的社交特征学习所获取的用户特征表示,其中k为图卷积网络中输出层的层数,将用于形成最终的增强的用户浏览事件特征;

47、步骤3.2、基于图神经网络的用户浏览序列分析预测,包括图神经网络模块和向量嵌入的事件分析预测;

48、步骤3.2.1、利用图神经网络模块处理用户浏览事件序列,构建并更新用户浏览事件的会话图g=(v,e),得到更新后的节点状态表示在时间步t时的状态;

49、步骤3.2.1.1、将会话中的每个用户浏览事件si转换为图节点,构建会话图g=(v,e),其中v是节点集合,e是边集合;

50、步骤3.2.1.2、初始化每个节点的状态其中xv是节点v的初始特征向量,上标t代表转置,表示节点v在第一轮迭代的初始状态,;

51、步骤3.2.1.3、通过门控机制更新节点状态,包括聚合邻居节点信息计算更新门重置门候选状态最终状态更新:

52、

53、是在时间t聚合的邻居信息;av是邻接矩阵a的第v行;表示时间t-1的节点i的状态;b是偏差向量;表示为更新门,控制当前状态到新状态的更新量;为重置门,确定遗忘的信息;是时间t的候选状态;⊙表示元素乘积,|v|中v代表节点集合,|v|代表节点个数,wz,w,u,uz,wr,ur为权重矩阵,σ(·)是激活函数,tanh(.)是激活函数,的含义是节点v在t-1时刻的状态。

54、步骤3.2.2、结合频繁模式挖掘和用户社交特征向量进行事件分析预测,得到增强的用户浏览事件特征表示作为输入,训练模型,模型输出当前实体后续可能发生的事件及其概率;

55、步骤3.2.2.1、使用频繁模式挖掘技术提取频繁浏览事件模式,构建全局事件关联图;

56、步骤3.2.2.2、通过gcn提取频繁事件特征向量

57、步骤3.2.2.3、整合用户特征向量得到用户社交关系特征向量

58、步骤3.2.2.4、计算增强的用户浏览事件特征表示其中β1和β2为可变参数,β1+β2=1,β1>0,β2>0;

59、步骤3.2.3、将融合后的增强的用户浏览事件特征作为输入,训练模型,具体而言对于每个事件实体u,模型都会输出当前实体后续可能发生的事件及其概率,选择评分最高的k个事件输出为最终结果。

60、因为本发明采用上述技术手段,因此具备以下有益效果:

61、1.数据预处理:通过清洗和预处理用户浏览历史事件数据,包括商家信息、用户信息、用户浏览信息,以及去除无效数据和重复值,合并数据源,使用时间滑动窗口分割时间段序列。解决了原始数据质量不高、数据重复和缺失的问题,提高了后续分析的准确性。

62、2.频繁模式挖掘:使用fp-growth算法挖掘频繁用户浏览事件序列,创建fp字典树并初始化头指针表,构建辅助数据结构trie,从fp前缀树提取频繁项,生成条件模式基,递归构建条件树挖掘频繁模式。解决了用户浏览数据中事件模式识别的难题,提取出有意义的浏览模式。

63、3.图神经网络分析预测:基于用户的社交特征学习,构建用户社交网络并使用图神经网络获取用户特征表示,利用图神经网络处理用户浏览事件序列,构建并更新用户浏览事件的会话图,结合频繁模式挖掘和用户社交特征向量进行事件分析预测。解决了传统方法未考虑用户社交关系对浏览数据影响的问题,通过学习用户社交网络结构,提高了预测的准确性。

64、本发明的优势在于,它不仅考虑了用户浏览历史事件的直接特征,还深入挖掘了事件间的关联关系,并通过图神经网络学习了用户的社交关系,从而提高了用户浏览事件分析预测的准确性。相比现有技术,这种方法能够更全面地捕捉用户行为背后的复杂性,为用户提供更精准的浏览趋势预测。

文档序号 : 【 40123507 】

技术研发人员:朱家辉,牛新征,文帅,罗涛,张杨,易志军,李松明,闫超
技术所有人:电子科技大学

备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
朱家辉牛新征文帅罗涛张杨易志军李松明闫超电子科技大学
一种电热水壶水垢去除装置的制作方法 一种基于同步辐射衍射的晶圆缺陷三维表征装置和方法
相关内容