人工智能助力医疗健康

人工智能发展迅猛,更能辅助医疗健康。

回顾医疗和生命科学的基本层面,绕不开以下几个主题:

1.Therapeutics(治疗)-药物研发,医疗仪器,数字化治疗方案。

2.Diagnostics(诊断)-‘组学’研究,生物技术检测。

3.Devices(医疗仪器设备)-生物医学工程创新。

4.Services(医疗服务)-服务模式,类别创新。

5.Platform(平台模式)-测序平台,数据存储平台等。

今天来谈谈图像识别的发力点。

1月20号,新年伊始:Arterys的影像平台成为FDA批准的首例AI辅助诊断工具。这个从0到1的突破,无疑是AI应用于医疗领域的一针强心剂。Arterys通个学习1000例心血管病变的影像,实现了媲美于人类的诊断结果,且用时仅15s,远远少于一位医生所需的时间(30min-60min不等)。同领域的创业公司还包括:Enlitic, Zebra Medical Vision, Butterfly, Curemetrix, Imagen等。从技术层面来说,静态、二维、电子化完善的放射科影像,作为机器学习应用的第一块试验田,并不出奇。但出色的临床试验结果、以及应用场景得到认可,市场教育初见成效,最终得到监管方的批准,的确是一个里程碑。

但同时,这个领域也有很多未知数。对于创业公司来说,不是单凭一个技术就可以改变行为模式。尤其是在算法开源、数据量相对可及的前提下,技术壁垒并不足以保证一个公司最终成长为独立的行业垄断者。在应用场景上应有更多细节,让技术无缝衔接到每日的工作流程中。不改变医生原有的工作习惯,才能最终颠覆原本的工作流程。我们需要有全新的PACS系统,新型智能影像设备,规范的影像诊断报告,医生更多的精力会放在审核、复查、和病人沟通解释之中。更进一步,图像中的信息可以嵌入到病历中,自动生成一个初步的分诊意见,尽可能减少人为干预的步骤。

或者,可以在移动端应用医学影像识别,为医疗机构之外的医生或者患者提供现场的诊断建议。如同在amazon上用拍照购物,或者用aipoly vision去识别物体一样。斯坦福学者的科研也已经证实,当前对皮肤癌的诊断,机器可以学会金标准,得出和医生相似的结论。

图像识别在药物研发也有所贡献。代表的公司有Recursion Pharmaceuticals。

AI应用于药物研发有不少的尝试,这个领域中代表的公司有:Atomwise, Numedii, Numerate, TwoXar等。大多数是基于计算化学/计算生物(computational chemistry/biology);通过对分子结构、化学属性的计算结合实验室的验证提高新药研发效率,或者通过分析病历,得出用药不良反应、药效的结果,可以挖掘新的适应症。

Recursion Pharmaceutical的方法略有不同。相对上述经典的分析角度,Chris(CEO)从细胞形态层面尝试分析药性和药效。一方面避免了庞大的测序结果分析以及数据存储,另一方面无需从散乱、非队列的临床病例中找寻规律,而是直观的利用AI,进行图像识别,从表达层面进行定性的分类。AI在分析图像上已经相对成熟,算法和训练数据在不同的专业领域无需太多修饰。如果细胞表现出阳性反应,可以指导实验室进行更深入的通路分析。同时,可以设计临床试验,加速新药研发进程。随着图像数量的提高,AI能够读出更细致、实时的改变,对于新知识的产生大有裨益。

除了解读完整的图像外,还可以设想,单纯提取某个特征——颜色、纹理、形状(长短、面积、距离),通过物理的传感器,也可以将其扩大、翻译、投射到相应的临床特征上。而深度学习善于将按照时间、空间顺序不断出现的图像整合,寻找规律。这和疾病的发生发展过程也是吻合的。一张图将真正抵得上一千个字。

我们已有理由继续相信,单在图像识别领域,AI就可以做出喜人的成绩。技术成熟后,如何更多的应用于不同场景,提高效率、降低错误率、节省人力成本、改善体验……可以预见,近期将会有更多的探索,更复杂的模式,和更深远的价值。不仅仅是图像,医疗数据中还有文字(语言)、声音(语音)等,都有不断的惊喜出现。我们在之后继续介绍。

挑战在于,NLP在处理电子病历以及科学文献方面的技术尚不成熟。NLP的深度学习在通识领域的研究比较多,对于语义单纯、逻辑清晰、对仗整齐的语文类型效果较好。医学术语中,同义词多样,否定和肯定的逻辑上不够明确,辐射和对仗都不够明确,思维逻辑也大多基于可能性和概率论,这样一种高度抽象的总结过程,是很难让机器明确掌握的。对电子病历中非结构数据的处理还处于襁褓,需要有足够的标识和积累,形成多维度的图谱(Hypergraph),并不断总结和提升,加强向量辐射的准确度,才能做出有意义的迭代。

当然,基于已有的结构化数据,例如生命体征的水平(血压、血糖、体重、体温、尿量等),实验室检查结果(血液、体液检查,生化指标;影像、病理、免疫组学),诊断(ICD诊断)以及处方(用药、手术记录等),已经可以得出初步的匹配分析。从出院总结、保险赔付的信息中,可以有效捕获相关的信息。

另一个方面,深度学习的模式识别也可以用于“组学”层面。通个基因组、蛋白组学的测序结果,和药物进行匹配,找出“药物基因组pharmacogenomics”的生物标签,从基因-细胞层面分析药物机制,找出潜在的作用靶点。

医学图像远远不局限于影像学的二维静态读片(x-ray,CT,MRI等),对于三维图像、动态图像、组织病理、细胞分子检测、生命体征和症状等,“看图说话”的可开发空间还有很多。

从需求分析,应用场景可以依照数据类型分为以下几类:

从医疗提供方角度

1.决策支持:基于症状、病史、检查、监测结果帮助病人和医生制定方案,覆盖整个疾病发展链,从预防、诊断、治疗、随访等方面。

2.人群管理:预测疾病风险,提供早期干预的时点和方法。

3.系统设计:优化医疗流程(从疾病诊断到保险付费)利用数据分析提高诊疗结果,同时降低成本花销。

从人群个体角度来看:

1.自我管理:实时监测健康情况,调整治疗方案,促进行为改变。

2.健康追踪:为个体定制健康追踪方案,弥补空白。

每一个主题,都有指数级增长的数据数量和不同的数据类型。排列组合,产生复杂的模型。曾经,医生只需要望闻问切就需要得出结论(无论准确度和精确度如何);而今,从问诊查体,可穿戴设备的数据到基因及微生物测序等,即使是专业的医生和科学家,也深感挑战巨大。医学教育、科研培训时限的延长不可持续,人脑处理信息的速度也难以跟上节奏,数据爆发的时代需要有新的工具。

      中国网是国务院新闻办公室领导,中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版,24小时对外发布信息,是中国进行国际传播、信息交流的重要窗口。

      凡本网注明“来源:中国网”的所有作品,均为中国互联网新闻中心合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。

电话:0086-10-88828000

传真:0086-10-88828231

媒体合作:0086-10-88828175

品牌活动合作:0086-10-88828063

广告合作:0086-10-88825964