范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

2021人工智能深度研究机器学习最终是否会代替人类医生?

  杭州健澜科技有限公司今天的话题:机器学习最终是否会代替人类医生?
  我们要探讨的这篇论文,它采取的方法,绝对可以比以往任何一种方法都好。本来我想在一篇博客里讨论好几篇类似的论文,可惜每一篇论文都有很多值得人们深思的地方(这篇文章就已经占了3000字了),所以每一篇论文我将花整个篇幅去深度探讨和理解。然后我将在几周里分开讨论这些文章,于是就产生了我博客中关于医疗人工智能这个系列专题。
  对于本次话题,我非常感谢 Lily Peng博士,这篇论文的作者之一,他对我提出的许多问题做出了非常充分的解答。
  这里先奉上一份简单的总结:
  TL:DR
  google(和他们的合作者)训练了一个系统,可以检测糖尿病视网膜病变(全世界5%的失明由它引起),该系统能够像一个眼科医生一样做出诊断。
  这是一个有用的临床任务,它可能不会节省很多的费用,也不会在医疗自动化以后取代医生,但是它的提出有很大的人文情怀。
  他们使用了13万个视网膜图像进行训练,比公开的数据集大了1到2个数量级。
  他们使用阳性案例丰富了他们的训练集,在某些程度上抵消了不平衡的数据分布带来的影响。
  由于大多数深度学习模型都是针对低分辨率的图像,所以原数据被下采样处理,丢弃了90%以上的像素值,然而我们无法评测这样做是否有利。
  他们雇佣了一组眼科医生来对图像进行标注,可能会花费数百万美元,这样做的目的是为了使标注更准确,避免出现误判。
  第5点和第6点是造成当前所有深度学习系统错误率高的原因,而且这个问题很少被谈及。
  深度学习之所以比医生更有优势,是因为它们可以在各个"操作点"上运作,相同的系统可以执行高灵敏度筛选和高特异性诊断,不需要再加额外的训练。
  这是一个很棒的研究内容,人们能够很容易的理解,并且在文本和补充中有很多有用的信息。
  这项研究似乎符合目前FDA对510(k)批准的要求。虽然这项技术不太可能通过,但是该系统或衍生物在未来的一两年内很可能加入到临床的实践当中去。
  免责声明:本文主要针对大众化的群体,包括机器学习领域的专家、医生等。相关专家们可能会觉得,我对一些概念的理解很肤浅,可是我还是希望他们能在自己研究领域之外找到更多有趣的新想法。还有一点要强调的是,如果这篇文章里有任何说错的地方,请读者告诉我,我会及时改正。
  研究现状
  在讨论之前,我想提醒大家,虽然从2012年开始,深度学习就逐渐发展成一种研究者经常使用的方法,但是五年之内我们并没有在医学中使用这种方法,为了安全起见,我们的医疗人员也通常比技术的发展落后一步。大家了解到这个背景以后,就可以想象到现在取得的一些成果更是令人难以置信,而且我们应该客观地认识到,人工智能对医疗的发展只是一个开始。
  在论文中提出了,医疗自动化已经实现了突破性的进展,我会在本文中简单回顾一下,也适当地增加了一些有用的知识。我会进一步介绍这个研究,在介绍之前先花几分钟时间说明几个关键性的问题:
  任务——这项任务是临床任务吗?如果实现自动化,在医疗实践过程中会面临多大的干扰呢?为什么选择这项特定的任务呢?
  数据——如何收集和处理需要的数据?数据怎么处理才能符合医学实验和监管的要求呢?我们需要深入了解医疗人工智能对大数据的要求。
  结果——人工智能将战胜医生还是打成平手?他们究竟测试了什么?我们还能有什么其他的收获吗?
  结论——这个结果有多大的影响力?我们还可以进一步得到其他的结论吗?
  Google的最新研究
  任务:
  糖尿病视网膜病是造成失明的一个重要病变,其成因是由于眼睛后部的细小血管损伤的造成的。医生可以通过观察眼睛后部的血管进行诊断,这其实是一项感知任务。
  
  图一 例如,DL系统能够学会如何识别"棉花状斑点"一样的白斑图案
  他们训练了一个深度学习系统,可以完成和评估与糖尿病视网膜病变相关的几项工作,主要的成果是对一组糖尿病视网膜病变的病例进行评估,这些患者有着中度或者更严重的眼睛疾病(这组患者的治疗方式和非对照组的患者的治疗方式不同)。他们还测试了深度学习系统对其他严重的视网膜病变的识别能力,以及黄斑是否水肿的能力。
  数据:
  他们使用13万张视网膜图片对设计的深度学习系统进行训练,每个级别由3到7名眼科医生来投票确定,最终的结果以多数票来决定。图像是从四个地方的医院(美国EyePACS和3家印度医院)采集的可追溯的临床数据,由不同的相机拍摄出来的。
  他们在两个数据集上验证了这个系统(在医学中,术语"验证"是指不参与到系统开发、训练环节的患者,与机器学习中的测试集是一个意思)。其中的一个数据集是对EyePACS数据集随机采样得到的,另一个数据集来自3家法国医院(Messidor-2)的公开数据集。第二个数据集中的所有图片是由同一个相机拍摄的。这些测试集由7-8个眼科专家进行分级,同样采用多数表决机制。
  用来开发、训练的数据集中,视网膜病变的患病率占比55%,恶化率占比8%,验证数据中患者的患病率远远低于一般患者的患病率,在19.5%的患病率中,只有1.7%的严重或恶化。这样的数据集是研究者刻意设计的,训练集中有很多阳性病例(他们增加了病例,比通常发生在临床人群中更多)。
  对于数据集的质量,视网膜图片的分辨率通常在1.3到350万像素之间。这些像素被缩小到299*299的分辨率,也就是0.08百万像素(整整少了94%到98%的像素!)。这是他们设计的网络结构的特性,其他大小分辨率的图像不能使用。
  神经网络:
  他们使用了 Google Inception-v3 深度神经网络的预训练版本,这也是到目前为止使用效果最好的图像处理系统之一。预训练意味着这个网络已经拿来训练过一些非医疗的物体(例如猫和汽车的照片),然后再在这个基础上对特定的医疗图片进行训练。这也是网络只接受229*229分辨率图片输入的原因。
  结果:
  我认为这篇论文是深度学习在医学人工智能领域取得的第一大突破。机器与眼科医生拥有几乎相同的疾病判断能力,甚至可以与"中级"眼科医生进行较量,表现也相当不错。
  
  图二 这是所谓的ROC曲线,是判断疾病诊断系统的最佳方式之一。 通过计算曲线AUC下方的面积,能够将灵敏度和特异度结合在单一的指标中。99.1%是非常好的。
  彩色点是专业眼科医生的诊断结果,黑线是所训练的深度学习系统的诊断结果。正如你所看到的,如果我们将所有的彩色点连接起来,就可以得到眼科医生诊断结果的ROC曲线*,与深度学习系统的ROC曲线相似。如果你不了解ROC曲线,你可以相信我,这绝对是一个证明两种诊断结果相同的有效方式(食品药品监督管理局将同意我的看法)。
  他们的系统可以很准确的检测出黄斑水肿,但在一些严重的视网膜病变方面,它的绝对值(AUC值)数据有些差距,但与眼科医生的正面比较没有说明这些。
  讨论:
  关于这项研究,这里有一些有趣的事情要讨论一下。
  费用:他们雇用了一组眼科医生来标注他们的数据,一共有50万个标签需要去标注。如果按照正常的看病价格去支付医生,大概需要数百万美元。这笔费用比大多数创业公司的成本还要多,而且他们肯定无法接受只有一个单一数据集的标注任务。从统计的角度考虑,数据就是力量。对于医疗人工智能来说,只有金钱才能产生这么多数据。换句话说,金钱就是力量。
  任务:他们能够从眼睛的照片中检测到两类以上的"可视眼病"(中度或者重度视网膜病变),甚至更严重的视网膜病变和黄斑水肿。这些都是临床上非常重要的任务。最重要的是,这些任务涵盖了大多数医生在看糖尿病患者眼睛时在做的工作。当然,这个系统检测不出罕见的视网膜黑色素瘤,但是对于日常的眼睛检查,这是一个可以很好模拟医生的系统。
  数据:数据是很有趣的方面,原因有两个:质量和数量。
  从他们进行的系列实验中,我们可以看出来他们需要的图片的数量。他们还用不同数量的训练样本对系统的性能进行了测试。
  
  图三 数据集中图像的数量(单位:千)
  这幅图像给我们展示了一些非常有趣的东西,他们的训练集中图像的数量上限为6万例,这些图像至少在97%的灵敏度工作点。值得关注的是,这比已经公开的数据集大了一到两个数量级,如果你的实验能超过97%的灵敏度,毫无疑问你的数据需求也一定会增加。
  这个结果也向我们传达了关于数据集大小的其他内容。当他们努力复制眼科医生的工作时,对常见眼科疾病的灵敏度能够达到90%,但是对于重度或者更严重的疾病的灵敏度只有84%。可能是因为识别重度疾病的任务比较困难。
  另外,我还注意到"中度或者重度"疾病的训练数据是普通的3到4倍。绝对数据较少(约9500例vs 34000例),而且关于流行眼病的数据也较少(9%为阳性,30%为阳性)。
  机器学习需要训练分布不平衡的数据,但是不平衡的数据并不容易获得。以我的经验看来,不平衡的情况比低于30/70,机器学习会很难进行下去。这样的数据不仅使训练更加困难(较少的案例=较少的学习),并且也会让实际地诊断变得更加困难(系统在预测多类问题时会有一些干扰)。
  不过,我们发现研究小组也在试图解决这个问题。在筛选人群的过程中,"参考"疾病的患病率在10%以下,所以这是一个高度不平衡的任务。因此,他们采用了额外的阳性病例以扩增训练数据集,令患病率达到30%。这样,训练结果得到了提升。并且,系统对其临床普遍性约为8%验证数据表现的较好。
  但是,这种扩增较少的数据类型的方法只有在有更多的阳性案例情况下才有效,这种情况并不常发生。现在已经有了一些解决不平衡数据的方法,但是仍然没有找到一个解决不平衡数据的最佳方式。
  这里还有两个关于数据质量的有趣的现象。
  首先是数据的下采样。这个系统在比人类观测到的图片少98%像素点的情况下,能否观测结果和人类一样呢?我们可以肯定的说,这个系统真的可以做到。当然前提是大部分丢弃的像素必须是无用的噪声信息,否则会使深度学习系统训练的过程更加艰难。人类比计算机更善于忽视视觉噪音。
  这个意义实际上更深远,因为深度学习系统已经在很多场合用来处理小型图片,但对于百万像素的大型图片**的处理,还从没有过很好的效果。实际上,高分辨率图像可能包含更多有用的信息,但是并不能适用于深度学习系统。
  下采样的设想引发了一系列的问题讨论:
  深度学习能对高分辨率图像有更好的训练效果吗?
  低分辨率的图像是否适用于所有的医疗任务呢?
  从技术的角度来看,我们是否可以在深度学习中采用高分辨率图像呢?
  我不知道这些问题的答案,但是在接下来的几个星期,我们会通过阅读其他的论文来明确这些问题的答案。
  关于数据的质量的第二个有趣的内容就是标注的质量问题。在机器学习中,我们需要非常准确的信息。也就是说,我们希望训练数据能够被正确的标注。比如视网膜病变的训练数据就应该是真正的视网膜病变。这些理论说起来很容易,但在实际操作中,医生们对疾病的诊断意见常常会出现分歧。所以,论文作者只是提供了数据。
  
  你可以从这幅图中看到,对于中等或中等以上程度的疾病,有80%的概率,至少有一个医生得出了与其他人不一致的结论!所以,使用一致的标签就是为了减少可能出现的人为错误。
  然而数据集中的标签错误很难避免,并且危害着模型的性能。深度学习可以学习到任何你给它的东西。反过来说,如果标注出现问题,深度学习机器很容易做出误判。
  有一个达成共识的标注并不是解决这个问题的唯一方法。一些任务可能有更准确的信息,例如我们下周会看到的一篇关于皮肤病变的论文。这篇论文中的每个病变都有病理学家给出的活检证实的诊断,但是变化不大。在极端的情况下,一些任务有非常完美的标签。我自己的一个项目就在关注着一个不能被误解的标签——死亡率。
  我认为标签的关键在于你能得到的和你所投入的东西成正比。如果你使用个别医生的标签,至少你能和这个医生一样优秀。如果你使用共识性的数据,你将会比其中的任何一个人更厉害。如果你完整的使用校正信息,你可能会完美地完成任务。
  影响:我对作者提出将医疗机器人作为疾病筛查工具的想法表示衷心的敬佩。他们展示了机器和眼科医生一样的运行结果(假阳性率较低,但缺少一些阳性病例),同时还显示了系统优化筛选时的结果(识别几乎所有阳性病例,但还有几个假阳性)。
  这些系统和医生相比有一个主要的优势:人类医生在假设的ROC曲线上有一个单一的操作点,这是基于他们经验的灵敏度和特异性的平衡,并且很难用任何可预测到的方式去改变。相比之下,深度学习系统可以在ROC曲线的任何地方运行,不需要再加额外的训练。你可以在诊断模式和筛选模式之间进行切换,而且不需要额外的费用,这种灵活性真的太酷了!在实际的临床测试中非常有用。
  考虑到监管部门,这项研究已经接近于临床使用的水平。他们验证了从真实医疗中筛选的数据集的模型,并且每个案例都有多个参与者。这项称为MRMC研究,也是FDA用于计算机辅助检测系统的一般证据标准。尽管我们并不清楚这项研究和诊断系统的关系,但是如果这个系统或者类似的系统在最近两年里取得了FDA批准,我并不惊讶。
  这项任务在医疗费用方面还是很可观的。眼科并不是医学的一大部分,在成本方面,眼睛检查也并不会很昂贵。
  如果这个用人工智能进行眼部病变筛检的技术能得到推广,那么它人类的影响会非常大。在许多发展中国家,糖尿病病情日益严重,但是眼科专家奇缺。鉴于图像处理在低分辨率的图片上上成功率跟高,如果能将该系统与低成本且易于使用的手持式视网膜摄像机结合起来,可以挽救数百万人的生命。
  然而,即使人工智能可以代替医生对视网膜病变进行评估,这对医疗工作的影响还是很局限。并且,我认为视网膜病变筛查自动会很容易导致医生工作量增加,因为以前未确诊的患者现在也需要进一步地评估和治疗。
  现在我们只讨论了对视网膜病变的评估,在我们再看几篇论文以后,我们将能够探索医疗自动化轨迹的发展意义。
  接下来我会看看斯坦福大学的论文,他们声称训练的深度学习系统可以实现"对皮肤癌进行分类"。
  曲线上眼科医生的结果的分布让我觉得非常惊讶,因为不同的医生可能做出非常不同的预测。 其中有的医生认为有0个假阳性,而其他的医生认为有10%的假阳性。这是一个很大的错误范围。
  已经使用了一些解决方案,例如首先将图像进行切片操作。但这通常会大量增加负面例子的数量,加剧了数据不平衡的问题。

中国留学生赴美签证被撤销可笑的理由,军训照片都能被怀疑美国政府收紧审查中国留学生。图为美国驻北京大使馆外等候签证的中国民众。(MARKRALSTONAFPGettyImages)北京时间202109151116近日,中国留学生王子威的伊朗新型防空导弹有多强?超越爱国者和萨德!能否比肩S400?虽然说美国是世界上唯一一个超级大国,但是这种地位并不意味着美国就是无敌的存在,所以美国总在想方设法的清除一切可以威胁到美国的敌人,对于美国来说,能够直接威胁到美国本土的才是最大的威重男轻女的家庭有多么过分说说自己的故事吧。(哥,妹,妹)我是老二。96年,广东偏远农村家庭挺悲戚的,小时懵懂,爸妈虽有偏爱,不太明显。哥哥的新衣,他不喜欢我可以穿了。我比较皮穿过了基本妹妹穿不了了,妹妹的我家妹子嫉妒别人年薪百万冷静,冷静。凡事不要只看表面。很多时候我们羡慕嫉妒别人只看到了对方得到的,没看见对方付出和失去的,还有就是有时候真的就是一个机遇,你没那个机遇也没那个能力达到。自己冷静点好好想想。扛不住了?立陶宛主动对华求和,请求中国让各自大使重返工作岗位此前,台当局宣布将在立陶宛成立代表处,台媒自由时报在对此事进行报道时,还兴奋地称这是重大的外交突破。当天,中国外交部发言人赵立坚在主持例行记者会时对此事作出回应,强调中方反对建交国故意针对?英航母将远赴西太!专家无优势可言,搭载F35没用现在的英国显然不是曾经的日不落帝国了,英国再也不是世界舞台的中心,想当年英国要风得风要雨得雨,一直坐稳了资本主义国家的头把交椅,而且很长时间内都没有哪个国家能够撼动!但是随着两次世要超就超美国!中科院这次弯道超车,新型石墨烯晶片让美优势不再说到芯片,大家显然都知道这是我们非常大的短板,而美国在这方面的造诣已经非常高了,这也是我们短时间内很难超越的,而对于美国来说,这几年处处针对我们,压根就不希望自己在芯片方面的优势被新一代隐身舰载机即将首飞,性能全面超越大黄蜂,F35优势全无没有强大的海军,显然也不会有多强的舰载机,毕竟舰载机只会出现在航母以及两栖舰这样的大型舰艇上,美国是名副其实的海军大国,至今依然保留了11艘现役核动力航母,这个数量恐怕再过几十年也2021直招士官来了,高中毕业入伍就能领工资,年龄却有限制对于广大的高中毕业生来说,如何选择理想的大学就成为了人生中最重要的选择之一,在高考分数出来之后,总有一部分人开心,一部分人失落,毕竟不是所有人都可以考出理想的分数!只不过对于一部分我上班每天带饭去,会不会丢人?但是我习惯无所谓啦我老公每天上班午饭都是我准备的,为什么丢人?简直是所有人羡慕的对象好嘛!嫌丢人的都是自己内心自卑的人吧,总感觉要花大钱在外面吃才算有面子。我老公他们整个公司都是自己带饭,不带的就随9月28日,华尔街巨头秘密访华,中美或重修旧好?中方定调核政策外交部发言人华春莹重申中国核政策长期以来,美国都将中国视为是动摇其霸权的对手,随着中国综合国力和国际影响力的不断发展,美国日益对此感到恐慌,所以不择手段以各种方式对打压中国,试图打
亚里士多德哲学,究竟讲了些什么?向国人介绍国外历史人物或者学说,应当有一个基本的态度,实事求是,科学,全面,公正,让读者在阅读中,补充自己的知识库存,获取某种新思想,所谓开卷有益。一个人精力再充沛,在知识爆炸的今帮助爱因斯坦寻找以太随着中华民族的不断觉醒,我国精英越来越聪明,总是在关键时刻,能够为国家,为民族做出正确的决策。CEPC(环形正负电子对撞机)项目被否定,足以证明这一点。早在1963年,橡树岭国家实本体论问题,亚里士多德四因论同辩证唯物主义争论,终于有答案了学习哲学,研究哲学的人,首先遇到的就是本体论问题。在西方,超验的存在,存在的存在,在哲学中始终占统治地位,并且发展出后来的各种各样的哲学流派。但同时也发展出另一个重要学派,那就是费用什么世界观和方法论分析宇宙自然和人类社会,才符合科学?英国科学家李约瑟认为,从公元一世纪到15世纪,在长达1500的年的时间里,中华文明源源不断的输入西方,才使西方的蛮夷社会进入文明社会。马克思,培根等一大批西方知识分子认为,我国的四库布齐毛乌素沙漠都被消灭了,塔克拉玛干沙漠也能消灭吗?从唐朝开始,毛乌素沙漠就已经在地球上形成,由于黄河从这里流过,每当流经毛乌素沙漠时,都会导致黄河含沙量上升,以至于在黄河下游形成地上河,严重威胁我国黄河下游人民的生命财产安全。而且随处可见的银杏,为什么比大熊猫还要濒危?银杏在我国并不属于罕见生物,许多城市的街道小区中都种植有银杏,每当秋季时,金黄色的银杏还会成为当地的特有景观。银杏虽然非常常见,但其实银杏是银杏科唯一幸存的生物,原本它们也有许多兄狮子交配时,为什么要咬住对方的脖子,是怕它跑了吗?在看动物世界时,很多人会看到狮子在交配时,雄狮会咬住雌性的脖子,直到完成交配。那雄狮为什么要这样做呢?狮子的交配在自然界中,许多动物都有发情季节,但狮子是个例外,如果狮群中没有6个回交可以培育新品种,拯救濒危生物,为什么人们仍然反对回交?提到回交,很多人会相视一笑。但其实回交作为一种育种手段,育种师们经常使用这种手段来培育新品种。但是,回交是一把双刃剑,用在正确的用途上时回交可以帮助动植物繁衍生息,用在错误的用途上手无寸铁的人能打赢鬣狗吗?虽然我们在野外遇到鬣狗的概率并不大,但我们也可以设想一下,假如我们手无寸铁的遇到了鬣狗,那我们应该怎么求生。鬣狗鬣狗并不是一种动物,而是包含四种生物,分别是斑鬣狗,条纹鬣狗,棕鬣狗处理腿脚抽筋小妙招夏日炎炎许多人喜欢游泳,有时候用过猛或节奏紊乱的话就容易产生腿脚抽筋,或者在跑步,篮球足球赛场上有突发腿脚抽筋的情况,可用下面的妙招,几秒钟即可处理好腿脚抽筋问题。条件允许的话找地喉咙被食物卡住如何处置人们在吃鱼或骨头等食物时若不小心,有时候会被食物卡住喉咙。若发生这种情况,一定不要惊慌,要立即停止进食和喝水。采取这个办法就可以快速把食物吐出来,做法是被卡者用鼻子吸一口气,然后用