一种专病数据库的质量检测方法、系统、设备及存储介质与流程
技术特征:
1.一种专病数据库的质量检测方法,所述专病数据库中存储了若干个字段类型的字段结果,其特征在于,所述方法包括:
2.如权利要求1所述的质量检测方法,其特征在于,构造若干个用于得到某一字段类型下的字段结果的问题,其中:
3.如权利要求1所述的质量检测方法,其特征在于,读取专病数据库中该字段类型下的字段结果,并获取该字段结果所对应的原始医学文本,包括如下具体步骤:
4.如权利要求1所述的质量检测方法,其特征在于,预先构建的质量检测模型为qwen1.5-14b模型。
5.如权利要求4所述的质量检测方法,其特征在于,在将训练文本数据、目标答案和prompt题库中的得到字段结果的问题输入到预先构建的质量检测模型中,对质量检测模型进行训练,得到训练好的质量检测模型之后,还包括如下具体步骤:
6.如权利要求5所述的质量检测方法,其特征在于,在将原始医学文本数据和prompt题库中的得到该字段类型下的字段结果的问题输入到训练好的质量检测模型中,训练好的质量检测模型输出的预测字段结果之前,还包括:
7.如权利要求6所述的质量检测方法,其特征在于,损失函数为交叉熵损失函数,交叉熵损失函数的表达式为:
8.一种专病数据库的质量检测系统,其特征在于,所述系统包括:
9.一种电子设备,其特征在于,所述电子设备包括:
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至7任一项所述的专病数据库的质量检测方法。
技术总结
本发明涉及一种专病数据库的质量检测方法、系统、设备及存储介质,属于数据质量检测技术领域,方法包括获取待检测的专病数据库的字段类型;构造若干个用于得到字段结果的问题并将其构建成prompt题库;读取专病数据库中的字段结果,并获取该字段结果的原始医学文本,部分作为训练文本数据;获取训练文本数据的字段结果,得到目标答案;将训练文本数据、目标答案和问题输入到质量检测模型中,得到训练好的质量检测模型;将原始医学文本数据和问题输入到训练好的质量检测模型中,质量检测模型输出字段结果,将该字段结果与专病数据库中的字段结果的一致性进行判断。通过质量检测模型对专病数据库进行质量检查,减少了人力的耗费。
技术研发人员:郭浩宇,王辉,蔡卓人,李涛,郭鹏
受保护的技术使用者:北方健康医疗大数据科技有限公司
技术研发日:
技术公布日:2024/12/19
文档序号 :
【 40405249 】
技术研发人员:郭浩宇,王辉,蔡卓人,李涛,郭鹏
技术所有人:北方健康医疗大数据科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:郭浩宇,王辉,蔡卓人,李涛,郭鹏
技术所有人:北方健康医疗大数据科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
