2015/7/13 下午12:06:19 星期一
当前位置: 主页 > 鸠占鹊巢 >

依图医疗CEO:解读首登bet:Nature Medicine的中文NLP辅诊研究成果
时间:2019-05-31 21:44

依图医疗CEO:解读首登Nature Medicine的中文NLP辅诊研究成果

时间:02-13 11:16 阅读:4343次 转载来源:雷锋网

雷锋网按:以医学影像分析起家的依图医疗,其实也早已在医学NLP领域默默耕耘两年多。近日,其联合广妇儿研发的中文AI辅诊系统一炮打响。因相关论文是「全球首次」中文电子病历NLP技术刊发在顶级医学杂志上,该诊断系统备受业界关注。雷锋网第一时间采访到依图医疗CEO倪浩,深挖系统背后的技术细节及依图医疗在NLP领域的布局与思考。

2月12日,国际知名医学科研期刊Nature Medicine(《自然医学》)在线刊登了一篇题为《使用人工智能评估和准确诊断儿科疾病》(Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence)的论文,这是顶级医学杂志全球首次发表通过自然语言处理中文文本型电子病历进行临床诊断相关技术的论文。 

依图医疗CEO:解读首登Nature Medicine的中文NLP辅诊研究成果

论文阐述通过深度学习与知识图谱相结合,解构临床电子病历数据,形成一套智能病种库,并在其基础上构建辅助诊断模型的技术。也就是说,有了这项技术,计算机能够「读懂」病历,并进行初步诊断。

其中,「智能病种库」是此次研究的核心成果,基于该病种库进行系统开发拥有很大的想象空间。除上述辅助诊断模型外,智能导诊、辅助问诊等系统也可基于该病种库搭建,能够有效缓解医疗资源不足、分配不均的问题,推动医疗供给侧改革进程。

据悉,此项技术及论文由广州市妇女儿童医疗中心(以下简称「广妇儿」)夏慧敏教授、加州大学圣地亚哥分校张康教授、广妇儿数据中心梁会营博士、医务部孙新主任以及儿内科门诊何丽雅主任团队与依图医疗、康睿智能科技等业内顶级研究团队及广东省再生医学重点实验室联合研发并撰写。

6000余个Schema,55种疾病

依图医疗CEO倪浩介绍,本次论文所述的是依图医疗在NLP领域两年积累的成果,期间依图医疗进行了大量的基础性研究,如知识图谱的构建、结构数据的清洗标注、标注体系的设计、算法的选择等。

整个系统的运作分为两部分。首先,基于医疗知识图谱,利用深度学习技术按照一定规则解构临床电子病历数据,将非结构化文本数据变为结构化数据,建成一套智能病种库。进而,基于这套智能病种库搭建各种诊断模型,365体育滚球直播投注网,本次发布的论文中,团队搭建了一套辅助诊断系统,系统通过读取病人病历向医生提供诊疗建议。

具体说来,在病种库构建阶段,团队先根据医学指南、专家共识库等现有材料构建医学知识图谱,并在该知识图谱的基础上,采用深度学习技术按照「标准解构Schema」解构训练所用的电子病历数据。这些Schema由依图医疗及广妇儿各位专家主任共同制定,用以描述某一病种的所有有意义的特征。

同一病种的不同维度(如诊断、家族史、主诉、实验室检查、影像学检查、超声检查等)被分别构建独立的Schema。依图医疗表示,已联合30余位高级儿科医师及10余位信息学研究人员构建了6000余个Schema,搭建起基础模型,并通过大量数据训练,365体育投注,形成前文所述的「智能病种库」。该病种库现已覆盖55种疾病,且在持续检验迭代中。

倪浩为整个过程进行了更加形象的解释。系统的目的是基于Schema从原始电子病历数据中提取信息点,并将其结构化、标准化,因此采用LSTM的注意力机制搭建模型,通过不断对文本进行「提问」抽取信息。例如在对文本「左肺上叶可见肿块」进行解构的过程中,系统通过不断的「提问」——「是不是左肺上叶?」「左肺上叶有没有肿块?」……抽取信息。实际上,提问的过程就是扫描文本的过程。

病种库构建好后,团队利用分层的逻辑回归的分类器建立诊断模型。倪浩介绍道,该模型与其他系统的不同之处在于其采用层次化结构进行判断。

第一级分类使用基于器官的方法,诊断首先被规范成广泛的器官系统(如呼吸系统、神经系统、消化系统等);第二层进一步细化,分成器官子系统和更具体的诊断组(如上呼吸道和下呼吸道);同时,采用病理生理学或病因学方法(如感染性、炎性、创伤性、肿瘤性等)将诊断分层决策树的设计调整至临床最适用的情景。

依图医疗CEO:解读首登Nature Medicine的中文NLP辅诊研究成果

诊断模型的层次化结构

130万份训练所用病例,88.5%诊断准确率