一种川崎病诊断系统

本发明属于医学人工智能领域,尤其是涉及一种川崎病诊断系统。
背景技术:
1、川崎病是一种全身炎症反应综合征,为主要发生于5岁以下儿童的急性自限性血管炎,因容易并发冠脉损害造成冠脉血栓形成、冠脉狭窄或冠脉瘤,进而引起心肌缺血甚至心肌梗死,已成为儿童获得性心脏病的主要病因。川崎病的发病率呈逐渐上升趋势,虽然静脉丙种球蛋白(intravenous immunoglobulin,ivig)治疗使冠脉病变发生率显著下降,但仍存在10-15%的川崎病患儿对ivig耐药,其冠脉病变的发生率更高。
2、引起儿童川崎病的病因众多,诊断流程复杂,可能引起诸多并发症,准确识别病因、实施精准治疗是儿科医生面临的巨大挑战。儿童川崎病常与多种疾病同时出现,与患者病史、基础疾病、先前治疗效果、持续时间和严重程度相关,对于儿科医生分析病情、关联病因提出较高要求。特别是基层医生经验不足,难以通过问诊进行精确诊断,从而导致误诊、漏诊并采用不恰当的治疗方案,进一步延长治疗和恢复时间,增大后续治疗难度。因此,运用人工智能技术学习儿科专家诊断治疗儿童川崎病的临床数据,构建一套辅助诊断模型并应用与基层,对于快速鉴别儿童川崎病儿及家庭痛苦,有效降低医疗费用支出。
3、如公开号为cn109273094a的中国专利文献公开了一种基于boosting算法的川崎病风险评估模型的构建方法及构建系统。构建方法包括:从样本数据集中提取可用于建模评估的有效样本;从有效样本的特征集合中筛选出符合现场医疗辅助诊断应用的10项特征;将有效样本的不完整数据集随机分割为训练集和验证集;使用boosting的方法拟合训练集进行模型构建,采用十折交叉验证法,记录最优模型参数;根据roc曲线使用验证集计算模型分类阈值t,从而构建得到川崎病风险评估模型。还构建相应的川崎病风险评估系统应用于对待评估数据进行评估,得到kdx评分。该发明有助于降低川崎病的误诊率和漏诊率,使患者在发病早期可以获得有效的预防、干预和治疗。
4、公开号为cn106339593a的中国专利文献公开了基于医疗数据建模的川崎病分类预测方法,包括步骤1:数据样本选择;从样本数据集中抽取可供建模的有效样本;步骤2:特征筛选;从构建样本数据的特征集合中筛选出符合现场医疗辅助诊断应用的19项特征进行建模;步骤3:川崎病分类模型构建与评价,包括使用随机森林分类方法在训练集上拟合xtrain数据集,记录最优模型参数和所有选取特征的权值;并根据分类模型进行测试集样本的分类预测。该发明将川崎病相关数据进行系统的分析、建模,并给出模型预测的评价方法,通过该模型能够基于川崎病数据,对病人川崎病进行有效的辅助诊断,使在发病前期进行有效的预防干预和治疗,为达到最佳治疗效果提供依据。
5、现有的一些评价模型可以通过使用患者的临床信息进行构建,从而达到根据样本训练分类模型的目的,然而,现有的数据构建模型往往只用到了单一种类的数据,无法很好的结合多种不同种类的数据,并将其应用于模型构建之中。同时,医疗数据有着维度大的特点,对于此类高维数据,传统的降维方法包括随机森林、线性判别分析和主成分分析等方法,然而这类的方法精度仍有提高的空间。因此,如何尽可能地应用川崎病患者及其对照组普通发热病人的多种检验检测数据,并从其中挖掘规律,辅助临床医生在普通发热患者中诊断川崎病,是目前亟需解决的问题。
技术实现思路
1、本发明提供了一种川崎病诊断系统,可以显著提升川崎病的诊断准确率和效率。
2、一种川崎病诊断系统,包括计算机存储器、计算机处理器以及存储在计算机存储器中并可在计算机处理器上执行的计算机程序,计算机存储器中存储有训练好的诊断模型,所述的诊断模型中包含图像令牌化子模块、文本处理子模块、交叉模态多头自注意力模块和分类模块;
3、所述的图像令牌化子模块采用预训练的vqgan模型,利用vqgan中的编码器对图像数据进行编码得到其在隐空间的特征,再利用vqgan中的码本模块对隐空间特征进行向量量化,将连续的特征空间映射到离散的向量空间,将图像数据转换为离散的图像令牌;
4、所述的文本处理子模块用于对文本数据进行处理,通过基于tokenization的方法进行分词得到文本令牌,再经文本处理子模块中集成的嵌入层以生成文本向量;所述的交叉模态多头自注意力模块用于对拼接后的图像令牌和文本向量进行注意力权重计算,将计算得到的特征矩阵输入分类模块后得到川崎病的各分型概率;
5、所述的计算机处理器执行计算机程序时实现以下步骤:将患者的超声心电图像数据和文本数据处理后输入训练好的诊断模型,得到川崎病的各分型概率。
6、图像数据为川崎病患者及普通发热患者的超声心电图数据,文本数据为临床检验数据,包括病人的影像报告和实验室报告。
7、进一步地,所述的vqgan模型包含码本模块(codebook)、编码器、解码器以及判别器;vqgan模型的预训练过程如下:
8、首先进行生成器的前向计算过程,包括:将预处理好的图像输入至编码器中得到其在隐空间的特征;由码本模块对隐空间特征进行向量量化取得其在码本中的特征表示;经向量量化后的特征再经解码器重建回原始图像;
9、接着,判别器对解码器输出的重建图像和原始图像进行真伪判别,以最大化判别器的错误,最小化生成器与目标概率分布的距离为训练目标。
10、该训练流程定义了vqgan中编码器作为与训练模型的权重获取及更新过程,后续多模态模型的图像编码过程不需依赖判别器。
11、使用预处理好的图像数据对vqgan模型进行预训练,图像数据的处理过程为:
12、川崎病患者及普通发热患者的超声心电图数据,通过去噪和标准化过程进行预处理,对图像应用随机旋转、缩放和镜像反转操作,进行数据增强。
13、对图像应用多种增强技术,有助于模型学习从多样化视角识别疾病特征,提高诊断的准确性和鲁棒性,得到增强后的图像矩阵。
14、通过对文本数据进行同义词替换和句子重构增强,得到增强后的文本数据。
15、所述的文本处理子模块包括预训练的自然语言处理模型和嵌入模型,先通过自然语言处理模块将输入的文本数据进行分词,再利用嵌入模型转换为文本向量。
16、自然语言处理模型采用llama-med模型,该预训练的llama-med模型在多个医疗领域的子任务上取得sota效果,如报告生成,医学问答等。
17、交叉模态多头自注意力模块采用基于transformer的架构处理多模态输入,该架构能够同时处理图像令牌和文本向量,工作过程如下:
18、将图像令牌和文本向量拼接,形成序列s,序列s进入交叉模态多头自注意力模块,通过一系列交叉模态多头自注意力层进行处理;每一层都包含以下步骤:
19、查询、键和值的生成:对于每个输入令牌s∈s,经可学习参数wi进行矩阵左乘计算查询q、键k和值v;
20、交叉模态自注意力计算:图像令牌pi使用其查询qi与文本令牌t的键kt和值vt进行交互;同时,文本令牌t使用其查询qt与图像令牌pi的键ki和值vi进行交互;
21、注意力权重的计算:使用softmax函数计算注意力权重,得到注意力输出;
22、多头自注意力整合:将图像对文本的注意力输出和文本对图像的注意力输出在多个注意力头中整合,形成增强的特征表示s';每个注意力头的输出通过不同的线性变换w处理后合并。
23、为了提高训练的稳定性和效率,对每个交叉模态多头自注意力层的输出加上输入前的残差,并进行层归一化处理。
24、分类模块采用多层感知机分类器,包括多个全连接层作为隐藏层和一个输出层,在隐藏层之间以selu激活函数加强模型建模非线性的能力,输出层使用softmax函数预测川崎病的分类。
25、训练诊断模型时,使用交叉熵损失函数作为优化目标,采用余弦退火调度器来调整学习率,使用adamw优化器进行诊断模型的参数优化。
26、与现有技术相比,本发明具有以下有益效果:
27、1、本发明的诊断模型包含图像令牌化子模块和文本处理子模块,图像令牌化子模块采用预训练的vqgan模型,对图像数据进行编码和量化,经码本对隐空间特征进行编码以生成离散的图像令牌。不同于常规的多模态特征融合方法,本发明创新性地将图像patch经词元化思想的启发进行离散编码以降低隐空间的信息损失,同时通过预训练的嵌入模型将文本数据转换为向量形式,最后再将得到的图像令牌和文本令牌进行融合。
28、2、本发明的诊断模型进一步引入了交叉多头注意力机制,该机制通过在图像令牌和文本令牌之间进行精细的信息交互,提高了特征的相关性和表示的丰富性。通过这种深度交互,本发明的诊断模型能够更全面地理解和分析患者的临床信息与相应的图像数据,从而显著提升川崎病的诊断准确率和效率。这种方法的应用不仅提高了诊断的精确性,还为临床决策提供了强有力的数据支持,有助于实现个性化和精准医疗的目标。
技术研发人员:俞刚,齐国强,龚方戚,耿志敏,苏礼贤
技术所有人:浙江大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
