童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

AI医疗场景化业务:如何用AI技术做食管癌识别和辅助诊断?

11月27日 回头爱投稿
  AI运用于医疗,通过机器学习的特点,可以辅助诊断。笔者分享了运用AI技术做食道癌识别和辅助诊断的经历,阐释了各阶段的难点。
  影辅助诊断主要做两件事情:
  医学知识图谱构建;
  基于疾病的诊断。
  今天我们来分析如何用AI技术做食道癌识别和辅助诊断。
  食道癌是世界五大恶性肿瘤之一,我国又是食道癌的高发地区。这个项目的目标是通过影像判别病人是否可能患有癌症。
  项目的整体流程如下:
  采集数据集:内窥镜探头一般从患者鼻腔进入,然后经过咽喉和食管,最后到达胃。我们采集食管数据的时候,可能会引入大量非食管数据。
  数据标注与模型建立:然后对这些数据做区分,通过食管判别模型,只保留食管数据。然后将食管数据送到下一个模型,这个模型只做一件事情,就是把正常的食管和异常的食管区别开来。
  图像分析:区分之后,再把病变的食管数据送到下一个环节,判断这个图像代表的是癌症还是炎症。
  整个流程大致可以分为这样三个阶段,接下来我会简单介绍每个阶段的难点。
  图像数据集少、表现不一
  通常的图像分类任务动辄几十万、上百万,甚至上千万的数据量相比,医疗影像它的数据量是非常少的。同时,由于设备参数、医生的拍照手法或拍摄角度、光照的明暗不同,食管的表观变化非常复杂。
  那么,我们怎样才能在这样的条件下得到一个可靠稳定的模型?
  采用Featuremap。FeatureMap是卷积核卷出来的,你用各种情况下的卷积核去乘以原图,会得到各种各样的featuremap。你可以理解为你从多个角度去分析图片。而不同的特征提取(核)会提取不同的feature,模型想要达成的目的是解一个最优化,来找到能解释现象的最佳的一组卷积核。
  在同一层,我们希望得到对于一张图片多种角度的描述,具体来讲就是用多种不同的卷积核对图像进行卷,得到不同核(这里的核可以理解为描述)上的响应,作为图像的特征。
  他们的联系在于形成图像在同一层次不同基上的描述。下层的核主要是一些简单的边缘检测器(也可以理解为生理学上的simplecell)。
  在拿到食管数据之后,如何判别这个食管属于健康正常食管还是病变食管呢?
  这个问题跟前面的问题比较类似,也是一个判别模型。
  它们的不同之处在哪呢?
  当我们判断一个食管是否异常食管时,只需要找到一个病变区域,就能够说明这个食管是异常的。
  但是反过来,在正常图像中,并不能说找到一个正常特征,就说明这个食管是正常的。只能说在这张图像中我们没有找到异常特征,它可能是见正常的。
  因此,在正常特征和异常特征之间,我们更倾向于提取病变特征,抑制正常特征。
  我们是怎么做到呢?
  病变和正常的case都会经过神经网络,以得到特征向量。对于这个向量,我们希望尽可能凸显异常特征,让正常特征趋近于0。
  我们是如何把这种信息建模到模型中的呢?
  我们对模型进行了重新建模,最后准确率大概在97左右。
  前面的模型相对来说比较简单,第三个模型主要是区分炎症和癌症,它与前两个问题不大一样。
  一般情况下,病变的食管图像里都会伴随着一些炎症的特征。
  我们对癌症的判断往往是通过一个纹理特别小的区域得出的,因此需要提取出更加精细化的特征。比较好的做法就是让很多专家把病灶区非常严谨地标注出来,这样我们只需要对这个区域进行识别就好了。
  这个标注量非常大,因此数据异常匮乏。我们没有癌症区域的标注数据,但又希望得到非常精细化的特征,如何解决这个矛盾呢?
  幸运的是,我们虽然无法获取到非常精准的病变区域标注影像,却能够相对容易地知道一张图像是否包含癌症,因为只需要跟病例对应关联起来就好了。这样一来,我们可以更容易地得到图像全局的标签。
  如果一张图像包含了癌症,必然会有一个或几个区域包含了癌症的特征。也就是说,如果我们把图像切分成几个patch,必然会有某个或某几个patch包含癌症特征。基于这样一种思路,我们采取了多序列的学习方式。这个方法的内在思想很简单,就是把图像切分成若干个patch,然后对每个patch建模,判别这个patch发生癌症的概率。
  我们最后把所有patch里面癌症概率最高的那块,作为图像是否包含癌症的标签。
  做的过程当中,我们会逐渐积累精准标注的数据,这些数据非常少,不足以虚拟一个模型。但图像中的特征都是最精准的,是经过人为校验和标注的。
  我们怎样才能把这种少量的、精准的数据强化到癌症识别中去呢?
  这是个非常有意思的问题,如果能解决这个问题,即使只有少量标准数据,我们也能不断提升。
  这里主要采用了多任务学习的方法,这个方法需要完成两个任务:
  基于有病变区域标注的数据建立有监督的学习任务;
  对于没有病变区域标注的数据,建立前面提到的多序列学习任务。
  这两个模型共享特征提取网络,特征提取网络必须同时满足两大任务,这样才能把精准标注的特征强化到癌症识别中去。
  以上是我们食道癌项目的简单介绍,下面再简单介绍一下我们在辅助诊断方面做的一些工作。
  辅助诊断的目的是什么呢?
  我们希望机器最终能够像临床医生一样具备诊断疾病的能力。
  在介绍辅助诊断项目之前,我们先来看看一个医生或者一个普通的学生是如何成长为一名专家的:一个学生从刚入学开始,学习了大量专业课程,阅读了大量专业医学文献后,就可以积累一定程度的医学知识。
  当医学知识达到一定程度之后,就可以去医院里面实习,由临床医生结合一些真实案例,指导他去学习诊断的技能。
  当我们具备了这些技能,就能够成为一名普通的医生,医生可以看到大量的病人,学习大量经验,经验足够丰富之后就成了专家。
  机器成长的过程与人类大致相似。
  我们可以将其分为三个阶段:
  医学知识图谱的构建,也就是机器学习知识的过程;
  有了知识之后学习诊断的能力,也就是建立疾病判别的一些模型;
  让机器在与专家的博弈过程中,不断提升诊断水平,逐渐逼近甚至超过专家。
  医疗知识图谱的构建过程中,我们首先要对文本数据进行处理。文本数据分成两类,一类是半结构化数据,一类是非结构化数据。
  这里我列举一个例子,说明我们如何把非结构化的文本变成结构化文本,也就是计算机可以理解的形式。
  我们可以把病史分为几个部分:疾病的情况、入院的治疗经过、入院的依据等;把病史分为这样几部分信息后,再对每一类信息进行细化和提取;经过提取之后,非结构化的文本就变成了计算机能够理解的结构化文本;我们会把这些信息转化为医学知识图谱存在电脑里,于是计算机就把这个知识学会了。
  以上就是医学知识图谱的构建过程。
  第二步我们会有一个诊断模型。
  诊断的过程是这样的,首先把一段人类语言描述的病情转化成计算机可以理解的结构化知识。有了结构化的知识以后,机器就能理解这个人的情况,把知识推送到疾病诊断模型当中,模型将给出一个疾病列表,诊断模型的流程大致就是这样。
  下面我们来看一个病情理解的实例。
  通过技术对病人病情的理解可以得到一些基本信息,其中包含性别、年龄,这个人的主动描述、现病史和既往史等。
  主动描述里会提到症状以及持续的时间,甚至一些更复杂的信息,比如说唾沫是什么样子的,咳嗽是否带痰。这些信息都会详细刻画出来,按照前面提到的模式画出病历,完成对病情的理解。
  理解病情以后,将其输入诊断模型当中。
  诊断的demo包含几个部分:对病情的人类语言的描述,通过病情理解后得到结构化的病情表示,之后得出机器诊断的结果,按照概率从高到低给出5个结果。
  我们还给医生留了一个接口,医生可以对诊断结果评分,通过评分将结果反馈到模型当中。
  通过医生和机器之间的交互,可以将模型迭代得越来越好。
  我们在实验室数据里选择了大概10万个真实病例进行测试,TOP1的结果与医生的一致率大概是92,TOP3是90,但这种模型还需要更多临床病例做验证。
投诉 评论

三步法完成AI产品需求分析笔者通过分析ToB图像类AI产品的需求,阐释了自己的工作经验所得。笔者希望能和大家一起探讨如何完成ToB图像类AI产品的需求分析,文中内容仅表示笔者在实际工作中的产品需求……智能家居全景本篇文章,笔者对智能家居一一梳理分析,带我们了解智能家居全景。2014年是智能家居元年,但目前85人还是不知道智能家居的概念,应该包含哪些设备功能。现在技术也是处于初级阶……VR时代的媒介:真实与虚拟,现实与幻象笔者回顾了历史上的各种媒介,从书本、报纸、广播、电视、电脑到手机,分析总结了各自的传播讯息并畅想了VR时代的场景。自上个世纪传播大师麦克卢汉提出媒介即讯息的观点,启发人们……移动时代,AI如何进行财富管理?笔者结合实际工作经验,描述了移动时代AI财富管理的阶段特征和服务路径。未来,AI财富管理将会逐渐实现融合生活的开放式服务。望各位读者读文先知,本文以工作中产品的实际应用经……基于NLG算法的智慧医疗:应用场景和构建经验在未来一段时间内,业务定制NLP系统将仍是真正能帮助大型智慧医疗行业达成业务目标的重要系统之一,也是AI落地的主战场之一。人工智能正处于非常火热的时期,自然语言处理(NL……AI奇点临近?手机即将终局,5G混战再起,AI已然来临。纵使5G兵临城下、AI狼来了,第六届互联网大会来得依旧没有第七届军运会惊心动魄。当然,在普罗大众心中活在当下确实有可能比预……AI医疗场景化业务:如何用AI技术做食管癌识别和辅助诊断?AI运用于医疗,通过机器学习的特点,可以辅助诊断。笔者分享了运用AI技术做食道癌识别和辅助诊断的经历,阐释了各阶段的难点。影辅助诊断主要做两件事情:医学知识图谱构建……智能家居生活是什么样的?一篇文章带你了解一个个智能家居单品的组合,最终构建成家居智能生态闭环。本篇文章,笔者对智能家居一一梳理分析,带我们了解智能家居全景。晚上一回家推开门,从过道到客厅的灯渐次亮起,窗帘自动合……当AI开始拥有“潜意识”,我们还有隐私吗?AI会影响人们的隐私吗?文章对这个问题从算法和方面进行了分析与讨论,供大家参考。好久没有跟大家聊聊算法方面的新研究了。理由当然不是学术领域没有新闻,毕竟顶会们收到的论文也……AI也有偏见:你在机器“眼里”是好人还是坏蛋?人工智能是从人类身上学习的,而人类是有偏见的生物。近日,麻省理工的博士生在两项独立研究中发现,虽然机器擅长识别人工智能生成的文本,但是很难分辨其中的真假。原因在于训练机器……AI产品经理的进阶路线图AI产品经理区别于普通产品经理的地方,不止在懂得AI算法,更重要的是具有AI思维。人工智能产品设计要以操作极度简单为标准,但是前端的简单代表后端的复杂,系统越复杂,才能越……AI面试官来临,教你三招搞定他你永远不知道你的面试官是人还是人工智能。AI面试官来了,笔者为我们总结了相关的攻略,一起来看看社畜们的演技巅峰,大多数时候不是奉献给了各种甩锅,就是用在了应对面试官身上。……
【天天问每周精选】第49期:传统行业如何合理利用互联网思维BAT把持的小程序战场,今日头条入局还有想象空间吗?从百度网盘为例,探讨工具类APP的用户拉新、留存策略抢占用户时长的移动下半场,腾讯死磕短视频之谜线上社交是怎么一步步变成陷上社交的?请问自媒体人:你有掉粉KPI吗?贝佐斯没有闹钟电商进化论,怎么抓住风口和机会互联网到底改变了什么?腾讯看似“被动”的调整,能解决自身问题?你也许并不真正了解腾讯估值750亿美金,从今日头条看字节跳动这家公司背后的产品逻辑北京市婴儿出生证办理流程盖帽绝杀!东契奇空砍三双,法国队决赛再战美国男篮关于努力奋斗的作文3篇开店选址的重要性与选址技巧蜂蜜姜汤什么时间喝可以事半功倍父母当心被宝宝利用了作文怎么查老婆有没有和别人发微信(老婆的微信记录哪里可以查)产妇皮肤痒有哪些原因3年败光60亿,儿子锒铛入狱,900亿华谊兄弟老板做了什么孽多巴胺分泌(恋爱产生的三种激素)世道如此悲夫张仪为什么日本人不爱创业?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界