一种医疗数据结构化处理方法及系统与流程

本发明涉及医疗信息处理,具体涉及一种医疗数据结构化处理方法及系统。
背景技术:
1、传统的病历记录方式依赖于医生手工书写或者打字输入,耗费大量时间和精力。同时由于手工书写或键盘输入容易导致录入错误,影响病历信息的准确性。
2、在当今医疗信息技术迅速发展的背景下,智能化语音转写技术正逐渐引起医疗界的关注和应用。该项技术通过将医生的口述转换为文字形式,大大简化病历记录的过程,提高医疗信息的准确性和可用性。
3、现有技术中,一般是通过语音转写引擎,直接将医生的口述信息转写成文字,在涉及到一些专有词汇过程中,无法智能化进行语音转写错误识别,容易出现断字、断句等情况。且,智能化转写虽然提升了记录效率,但是由于形成的文字记录为口语化,无法成为系统性、模块化的记录文件,不利于医院存档研究。
4、因而亟需设计一种医疗数据结构化处理方法及系统以解决上述技术问题。
技术实现思路
1、为解决上述现有技术的中的不足,本发明的目的在于克服现有不足,提供一种医疗数据结构化处理方法,该方法包括如下步骤:
2、获取医生进行病历录入的语音记录数据;剔除所述语音记录数据的干扰音,保存所述病历语音数据;
3、获取医生录入的病历语音数据,将所述病历语音数据转写为对应的病历文字信息;
4、构建病历语音转写查错模型,基于转写的病历文字信息进行病历语音转写查错:
5、若基于所述病历语音转写查错模型的评估结果为正常,输出对应的所述转写的病历文字信息;
6、若基于所述病历语音转写查错模型的评估结果为不正常,重新进行对应的所述病历语音数据转写为病历文字信息;
7、构建医疗病历知识库,将所述评估结果为正常的病历文字信息与所述医疗病历知识库匹配,输出匹配后的基于所述医疗病历知识库的医疗术语病历录入信息。
8、作为上述方案的进一步优化,所述剔除所述语音记录数据的干扰音的方法包括如下:
9、构建获取医生进行病历录入的语音特征模型,所述模型的影响因子为病历录入时间和任意单位时间对应的单段冲量比;
10、标记任一的病历录入语音获取开始点进行标记点记录,基于所述标记点按语音获取频率f,直至任一的所述病历录入语音结束获得标记点数h,则病历录入时间t为:
11、
12、标记任一的病历录入语音的总冲量c,基于所述标记点按语音获取频率f累计等分为x段,任一等分为x段的单段病历录入语音的冲量为ci(i=1,2,…,x),任一等分为x段的单段病历录入语音的单段冲量比为εi(i=1,2,…,x),则单段冲量比计算方法如下:
13、
14、作为上述方案的进一步优化,所述方法还包括:
15、基于构建的所述病历录入时间t和单段冲量比εi,对所有采集的录入声音检测:
16、若检测的单段冲量比先上升至最大值后下降,保留对应的录入声音;否则删除所有采集的录入声音,重复上述步骤;
17、基于保留的先上升至最大值后下降的录入声音,保留对应病历录入时间t最大值对应的声音为目标声音。
18、作为上述方案的进一步优化,所述基于转写的病历文字信息进行病历语音转写查错方法具体包括如下:
19、构建任意的病历文字信息分布模型l(b),如下所示:
20、
21、其中,l(bi|bi-p+1,…,bi-1)为所述病历文字信息分布模型l(b)的计算对象,表征为第i项病历录入词bi的分布情况;其中p-1表征为当前病历录入词bi的前p-1项病历录入词;
22、构建任意的病历文字信息容错模型t(b),
23、
24、其中,k(bi-1bi)表示为对应的所述病历录入词在所述医疗病历知识库出现的回数;
25、基于构建的病历文字信息分布模型l(b)和病历文字信息容错模型t(b),计算病历文字信息的任一病历录入词的下一项预判词汇准确概率:其中,ω为规整常量,λ是维稳系数,bi-1bi表示任意两个病历录入词组合;
26、
27、作为上述方案的进一步优化,所述基于转写的病历文字信息进行病历语音转写查错方法还包括如下:
28、设基于所述病历语音转写查错模型的评估结果的评价指数为right,则有:
29、
30、其中,表征为对任一病历录入词的当前录入概率描述,γ为描述权重。
31、作为上述方案的进一步优化,将所述评估结果为正常的病历文字信息与所述医疗病历知识库匹配方法具体包括如下:
32、生成任意的经病历语音转写查错的病例文本信息,将所有经识别检测的病历录入词标记为bi,则病例文本信息与病历录入词的集合表示为b=(b1,b2,b3…bm);
33、基于生成的集合b,构建深度神经引导卷积模型tend:
34、tend=aggcn(b,b) (7)
35、构建病例文本信息与医疗术语映射关联z,所述映射关联z构建如下:
36、
37、
38、其中,映射关联z1为跳跃度q1作为第一跳跃、跳跃度q2作为第二跳跃的对应关系,映射关联z2为跳跃度q2作为第一跳跃、跳跃度q1作为第二跳跃的对应关系,∫(q1,q2)表示为q1,q2的动态关联。
39、作为上述方案的进一步优化,在完成映射关联z的构建后,所述方法还包括如下:
40、获取映射关联z,将所述映射关联z输入至医疗术语转换集:
41、
42、其中,是s型函数,parz是基于病历录入词的录入参数矩阵,z12是映射关联z1与z2的点乘结果,是映射关联偏移向量。
43、作为上述方案的进一步优化,构建的所述模型包括病历文字信息录入起点、关系转换和录入终点。
44、本发明还公开了一种医疗数据结构化处理方法系统,所述系统包括如下:
45、语音过滤模块,用于获取医生进行病历录入的语音记录数据;剔除所述语音记录数据的干扰音,保存所述病历语音数据;
46、语音转写模块,用于获取医生录入的病历语音数据,将所述病历语音数据转写为对应的病历文字信息;
47、语音校验模块,用于构建病历语音转写查错模型,基于转写的病历文字信息进行病历语音转写查错:
48、若基于所述病历语音转写查错模型的评估结果为正常,输出对应的所述转写的病历文字信息;
49、若基于所述病历语音转写查错模型的评估结果为不正常,重新进行对应的所述病历语音数据转写为病历文字信息;
50、转写重定向模块,用于构建医疗病历知识库,将所述评估结果为正常的病历文字信息与所述医疗病历知识库匹配,输出匹配后的基于所述医疗病历知识库的医疗术语病历录入信息。
51、作为上述方案的进一步优化,所述语音过滤模块包括如下:
52、模型构建单元,用于构建获取医生进行病历录入的语音特征模型,所述模型的影响因子为病历录入时间和任意单位时间对应的单段冲量比;
53、语音标记单元,用于标记任一的病历录入语音获取开始点进行标记点记录,基于所述标记点按语音获取频率f,直至任一的所述病历录入语音结束获得标记点数h,则病历录入时间t为:
54、
55、冲量计算单元,用于标记任一的病历录入语音的总冲量c,基于所述标记点按语音获取频率f累计等分为x段,任一等分为x段的单段病历录入语音的冲量为ci(i=1,2,…,x),任一等分为x段的单段病历录入语音的单段冲量比为εi(i=1,2,…,x),则单段冲量比计算方法如下:
56、
57、本发明采用上述的技术方案,与现有技术相比,一种医疗数据结构化处理方法及系统,具有以下技术效果:
58、1.本发明通过设计了一种医疗数据结构化处理方法,具体通过构建病历录入的语音特征模型,计算任一的病历录入时间和病历录入语音的总冲量计算单段冲量比,并根据单段冲量比的折线图,快速准确筛选出需要的病历录入语音数据信息。
59、2.本发明设计提出的一种计算病历文字信息的任一病历录入词的下一项预判词汇准确概率方法,当病历录入词录入项为1项时,描述的病历文字信息的任一病历录入词的下一项预判词汇准确概率即为任意的病历文字信息容错模型计算结果;当病历录入词录入项为大于1项时,基于本发明设计的计算方法能够快速获得对应的出现概率。本发明设计为解决医生将病人的病况,通过语音转写的方式形成病历语音录入,针对性设计了病历语音转写的容错机制,即通过将病历录入词由语音转写成文字,且基于任意已经转写的病历录入词进行下一项语音转写的病历录入词预判,从而形成识别度高、更贴合医生口述实际的病历语音转写数据信息。
60、3.本发明设计的基于所述病历语音转写查错模型的评估结果的评价指数,能够进一步反馈出病历语音转写的准确程度,直观的表述出医生实际要转写的病历信息,提升工作效率。
61、4.本发明通过创建一种医疗数据结构化处理方法,具体以实际病症的病历状况为核心进行辐射,基于建立的医疗病历知识库,能够快速帮助医生将实际病症的属性医疗术语进行快速匹配和关联,使得医生在进行病历状况转写过程中,快速、准确完成实际情况匹配,效果良好。
技术研发人员:柳春杨,贾雪涛,王杨,付业训,杨宪刚,谷蒙蒙
技术所有人:北京医玖科技有限公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
