一种用于分类不平衡流数据的新型主动学习方法
技术特征:
1.一种用于分类不平衡流数据的新型主动学习方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,s1所述知识库包括每个类别的单独窗口,表示为kb={w1,w2,…wc},其中c代表到目前为止识别的类别总数,在每个窗口中,数据样本存储为四元组:(x,label,ω,ωca),其中x是数据样本,label表示真实或预测的类别,如果未知则保持未定义,ω是分配给样本的权重。
3.根据权利要求1所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,s2所述集成包括多个k最近邻k-nn分类器,集成内部的多样性由参数θ控制,该参数确定k-nn分类器的数量:
4.根据权利要求1所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,s3所述方法包括如下关键阶段:
5.根据局部密度度量或其他相关特征修改每个亲和力:
6.根据权利要求1所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,所述s4包括:
7.根据权利要求6所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,引入一种概念适应策略:
8.根据权利要求6所述的用于分类不平衡流数据的新型主动学习方法,其特征在于,所述s4包括s4.2:知识库数据管理:
技术总结
本发明的目的是引入一种专门为分类不平衡流数据而设计的新型主动学习方法。它有效地适应了实时数据流的动态挑战。该方法的核心是一个先进的数据管理系统,该系统使用复杂的结构创建紧凑的数据摘要,这对于克服内存限制至关重要。该方法使用多窗口知识库,为每个数据类设置单独的固定大小窗口,以保持独特的结构并有效地解决不平衡问题。它还包括一组动态调整以适应数据变化性的k‑最近邻k‑NN分类器。主动学习部分通过混合使用不确定性和随机抽样,专注于代表性不足的类别,优化了有限标签资源的使用。这种全面的策略不仅解决了数据变化性、新标签和类别不平衡的问题,还提高了标签过程的效率,确保在动态数据环境中实现高准确性和适应性。
技术研发人员:乌丁·萨拉赫,杨勤丽,邵俊明
受保护的技术使用者:电子科技大学长三角研究院(湖州)
技术研发日:
技术公布日:2024/11/28
文档序号 :
【 40163937 】
技术研发人员:乌丁·萨拉赫,杨勤丽,邵俊明
技术所有人:电子科技大学长三角研究院(湖州)
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:乌丁·萨拉赫,杨勤丽,邵俊明
技术所有人:电子科技大学长三角研究院(湖州)
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
