数据处理方法、装置、设备及计算机可读存储介质与流程

本技术涉及计算机,具体涉及一种数据处理方法、装置、设备和计算机可读存储介质。
背景技术:
1、随着社交媒体、在线论坛和电子商务平台的兴起,用户们可以自由地分享各种形式的内容,如文字、图片、视频等,这些内容被称为用户生成内容(user generatedcontent,ugc)。在游戏领域,游戏ugc内容的流行度日益增长,吸引了广大的受众群体。然而,游戏ugc内容的质量参差不齐,特别是在游戏画面的复杂性下,很难准确识别出不合规的内容。
2、在相关技术中,为了确保平台的游戏ugc内容的合规性,通常需要安排大量的人工审核资源进行审核,这种方式不仅加重了人工审核的负担,而且审核效率较低。
3、因此,如何提高内容审核的效率是亟待解决的问题。
技术实现思路
1、为解决上述技术问题,本技术的实施例提供了一种数据处理方法、装置、设备以及计算机可读存储介质,可以提高内容审核的效率。
2、其中,本技术所采用的技术方案为:
3、一种数据处理方法,包括:
4、对待审核数据进行特征提取处理,得到多个特征信息;
5、基于所述待审核数据的类型所对应的权重信息,对所述多个特征信息进行融合处理,得到融合特征信息;
6、基于所述融合特征信息计算所述待审核数据的审核通过率;
7、基于所述审核通过率对所述待审核数据分配审核资源。
8、一种数据处理装置,包括:
9、处理单元,用于对待审核数据进行特征提取处理,得到多个特征信息;
10、融合单元,用于基于所述待审核数据的类型所对应的权重信息,对所述多个特征信息进行融合处理,得到融合特征信息;
11、计算单元,用于基于所述融合特征信息计算所述待审核数据的审核通过率;
12、分配单元,用于基于所述审核通过率对所述待审核数据分配审核资源。
13、在本技术的一个实施例中,基于前述方案,所述待审核数据包括游戏文本内容;处理单元,还用于对所述游戏文本内容的文本长度、文本结构和词频信息中的至少一种进行分析,得到基本文本特征信息;对所述游戏文本内容中的命名文本进行特征提取,得到深度文本特征信息;其中,所述命名文本包括所述游戏文本内容的以下信息中的至少一种:游戏角色名称信息、装备名称信息、地图位置信息、游戏配乐信息、游戏任务信息和技能名称信息;对所述游戏文本内容进行关键词提取,得到所述关键词文本信息。
14、在本技术的一个实施例中,基于前述方案,所述待审核数据包括游戏图像内容;处理单元,还用于对所述游戏图像内容的图像数量、图像尺寸和图像类型中的至少一种进行分析,得到基本图像特征信息;对所述游戏图像内容中的游戏静态特征进行识别,得到深度图像特征信息;其中,所述游戏静态特征包括所述游戏图像内容的以下信息中的至少一种:装备信息、地图位置信息、角色建模信息、游戏剧情信息和角色状态信息;对所述游戏图像内容进行视觉检测计算,得到图像视觉特征信息。
15、在本技术的一个实施例中,基于前述方案,所述待审核数据包括游戏视频内容;处理单元,还用于对所述游戏视频内容的基本属性进行提取,得到基本视频特征信息;其中,所述基本属性包括所述游戏视频内容的以下信息中的至少一种:时长、分辨率、帧率和格式;对所述游戏视频内容中的游戏动态特征进行识别,得到深度视频特征信息;其中,所述游戏动态特征包括所述游戏视频内容的以下信息中的至少一种:角色动作信息、语音信息、地图场景信息、角色建模信息、角色状态信息、游戏配乐信息和游戏资产信息;对所述游戏视频内容进行视觉检测计算,得到视频视觉特征信息。
16、在本技术的一个实施例中,基于前述方案,计算单元,还用于基于所述多个特征信息进行类型计算,确定所述待审核数据所属的类型;处理单元,还用于基于所确定出的类型获取权重列表,所述权重列表包括每个特征信息的权重;融合单元,还用于基于所述权重列表对所述多个特征信息进行融合处理,得到所述融合特征信息。
17、在本技术的一个实施例中,基于前述方案,处理单元,还用于从所述多个特征信息中筛选出用于类型判断的特征信息,得到至少一个类型特征信息;对所述至少一个类型特征信息进行类型识别,得到所述至少一个类型特征信息的类型概率分布;基于所述类型概率分布计算出所述待审核数据所属的类型。
18、在本技术的一个实施例中,基于前述方案,处理单元,还用于所述对所述至少一个类型特征信息进行类型识别,得到所述至少一个类型特征信息的类型概率分布,包括:获取关键词列表,所述关键词列表中包括多个游戏关键词;基于所述多个游戏关键词,对所述至少一个类型特征信息进行游戏关键词匹配,得到多个游戏关键词匹配率;将所述多个游戏关键词匹配率作为所述至少一个类型特征信息的类型概率分布。
19、在本技术的一个实施例中,基于前述方案,处理单元,还用于获取与所述待审核数据所属的类型相匹配的历史审核结果信息;基于所述待审核数据所属的类型和所述历史审核结果信息,对每个特征信息进行权重分配,得到所述权重列表。
20、在本技术的一个实施例中,基于前述方案,处理单元,还用于在所述权重列表中获取每个特征信息的权重;其中,所述权重列表包含的所述多个特征信息中的潜在异常游戏数据的特征信息的权重大于所述多个特征信息中其他特征信息的权重;所述潜在异常游戏数据包括所述待审核数据的以下信息中的至少一种:用户文本信息、用户语音信息、角色行为信息和装备交易信息;基于所述每个特征信息的权重对所述多个特征信息进行加权求和计算,得到所述融合特征信息。
21、在本技术的一个实施例中,基于前述方案,处理单元,还用于基于所述待审核数据的类型选择出目标计算模型;利用所述目标计算模型对所述融合特征信息进行预测,输出所述审核通过率。
22、在本技术的一个实施例中,基于前述方案,在基于所述审核通过率对所述待审核数据分配审核资源之后,处理单元,还用于获取所述待审核数据对应的审核结果;基于所述审核结果对所述目标计算模型进行参数调整。
23、在本技术的一个实施例中,基于前述方案,处理单元,还用于基于所述审核通过率对所述待审核数据进行优先级排序;按照优先级排序的顺序对所述待审核数据分配审核资源,其中,分配审核资源的先后顺序与待审核数据的优先级排序成正相关关系。
24、在本技术的一个实施例中,基于前述方案,处理单元,还用于获取审核通过率表格,所述审核通过率表格中按照预设顺序记录了多个已预测数据的审核通过率;将所述待审核数据的审核通过率与所述多个已预测数据的审核通过率进行比较,确定出目标排序位置;将所述待审核数据的审核通过率添加在所述目标排序位置,得到更新后的审核通过率表格。
25、一种数据处理设备,包括处理器及存储器,存储器上存储有计算机可读指令,计算机可读指令被处理器执行时实现如上的数据处理方法。
26、一种计算机可读存储介质,其上存储有计算机可读指令,当计算机可读指令被计算机的处理器执行时,使计算机执行如上的数据处理方法。
27、一种计算机程序产品,包括计算机可读指令,计算机可读指令被处理器执行时实现如上的数据处理方法。
28、该计算机程序产品包括计算机程序,计算机程序存储在计算机可读存储介质中,电子设备的处理器从计算机可读存储介质读取并执行计算机程序,使得电子设备如上的数据处理方法。
29、在上述技术方案中,可以对待审核数据进行特征提取处理,得到多个特征信息,该多个特征信息可以从多个维度反映待审核数据的不同特征。接着基于该待审核数据的类型进行多个特征信息的融合处理,使得所得到的融合特征信息能根据待审核数据的类型进行灵活调整,具有更强的适应性,能更好地满足不同类型数据的审核场景,提高了审核通过率的准确性,促进审核资源的分配,提高了内容审核的效率。
30、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
技术研发人员:李建勇
技术所有人:深圳市腾讯网络信息技术有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
