童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

基于NLG算法的智慧医疗:应用场景和构建经验

9月25日 无镇楼投稿
  在未来一段时间内,业务定制NLP系统将仍是真正能帮助大型智慧医疗行业达成业务目标的重要系统之一,也是AI落地的主战场之一。
  人工智能正处于非常火热的时期,自然语言处理(NLP)领域也令人兴奋了十年。
  在阅读理解、语言翻译和创意写作等复杂的任务上,计算机的表现将会和人类一样出色。语言理解能力受益于免费的深度学习库(如Pytext和BERT这样的语言模型),大数据(Hadoop,Spark,SparkNLP),以及云计算(提供GPU和与服务商的NLP服务功能)。
  目前市面上做自然语言处理领域的公司有:腾讯、科大讯飞、微软、思必驰、华为等。
  在医疗领域,一些应用已经从科幻小说变为现实。
  人工智能系统通过了中国和英国的医学执照考试,而且它们比普通医生考得更好。最新的系统比初级医生能更好地诊断出55种儿科疾病。
  但是,这些系统比第一批计算机视觉深度学习应用(例如研究一个图像)中的一些更难构建,因为它们需要具有更广泛常见的医学知识,要处理更多种类的输入,并且必须理解上下文。
  我很幸运能够参与构建医疗领域的NLP系统。
  本文旨在分享我学到的一些知识,从而希望能帮助你更快更好地构建类似的系统。
  一、什么是NLG,它是如何工作的?
  自然语言处理由自然语言理解(NLU)和自然语言生成(NLG)构成。
  NLG是计算机的“编写语言”,它将结构化数据转换为文本,以人类语言表达。即能够根据一些关键信息及其在机器内部的表达形式,经过一个规划过程,来自动生成一段高质量的自然语言文本。
  如今的数据量巨大,人们根本处理不过来;NLG把数据人性化,帮助人们处理。
  NLG系统使用数据分析和人工智能技术来分析复杂的数据集,并采用计算语言学技术在高品质的文字说明来交流分析结果。
  NLG的工作原理:输入抽象的命题,然后对你输入的自然语言进行语义分析、语法分析进行语言组织然后生成无限接近你想要的文本。
  例子:输入麦当娜,接下来通过NLG自然语言生成:麦当娜“歌星”
  二、NLG算法在智慧医疗领域应用有哪些?
  三、NLG算法对患者影响有哪些?
  NLG可以用来帮助患者,让他们了解自己的健康状况,并对自身的医疗保健作出更好的选择;NLG还可以帮助患者更好地照顾自己:包括改变生活方式、自我管理慢性疾病、并配合治疗方案。
  例如,许多糖尿病患者都有测量血糖水平的传感器,但他们很难利用这些信息来管理他们的糖尿病,因为他们通常看不懂测量结果,所以当他们看到血糖变化时,往往过度反应。NLG系统可以解释和情境化血糖的任何变化,并帮助糖尿病患者作出适当的反应。
  四、NLG算法对医护人员影响有哪些?
  临床医生最热衷于报告自动化工具,因为他们认为其有两个好处:自动化节省了他们的时间;自动化还意味着更少的错误和遗漏,以及数据的一致性。
  我已经在该领域上的几个系统工作过,主要是产生交接报告(护理交接班,第一急救者移交医务人员),并且知道在这个领域许多其他NLG项目。
  我觉得使用NLG为临床提供决策支持有很大的潜力,确实有大量的证据表明,临床医生目前来看数据的方式(通过可视化或表格)有时不是很有效。而文本概括可以通过突出显示可视化看不到的重要信息来帮助决策。事实上,自动撰写报告比临床决策支持的卖点更突出。
  最重要的是用NLG来加强病人对病情的了解和支持病人,更好的作出治疗方案。
  五、NLG构建的一些经验
  1。现成可用的NLP模型不起作用
  在系统构建的实践中,为中文构建的现成的NLP库和算法在医疗行业的这种“不同的语言”上会遇到各种挫败。
  不仅是因为命名实体识别或实体解析模型会失败,甚至像符号化、词性标注和句子分割这样的基本任务,现成的模型对大多数医疗行业的句子都没用。
  再者医疗行业有数百种语言,千万不要去建立通用的医疗NLP系统。现实是,每个子专业和它的沟通形式都和别专业根本不同,你根本无法做到统一通用。
  而且,每个医学专业都有很多变化。例如,对于决定是否批准针对MRI的预授权请求,针对植入式脊髓刺激器,需要从预授权表格中查看的项目内容就和别的请求完全不同。另一个例子是在病理学中使用不同的术语来讨论不同类型的癌症。
  这些对实际问题会带来影响:我所工作的公司正在进行一个项目,该项目需要训练不同的NLP模型,以从病理报告中提取有关肺癌、乳腺癌和结肠癌的事实。
  到目前为止,亚马逊的ComprehendMedical仅关注药物价值的正规化(参见上面最后一个“阿司匹林”的例子)。该服务还具有标准的医疗命名实体识别功能,但不能满足任何特定应用的需求。
  我从以下流行的NLP云服务自测,通过几个平台的测试。
  IBMWatsonNLU
  GoogleCloudNaturalLanguage
  SpaCyNamedEntityVisualizer
  AzureTextAnalytics
  AmazonComprehend(offline)
  斯坦福大学CoreNLP
  进行的一项测试中,上述六个引擎唯一识别出的医学术语(其中只有两个引擎识别了出来)是Tylenol(泰诺)是个产品。
  2。如何自建NLP?
  了解到“医疗行业的语言”与人类语言是多么的不同。
  以下是我们构建的一些项目内容:
  1)基于深度学习的句子分割
  虽然分割维基百科文章的句子通常只需要使用正则表达式就可以完成,但处理很多页的临床文档是一个更大的挑战。特别是,算法必须应对页眉和页脚、列表、枚举、标注、两栏格式和其他的格式问题。
  2)医疗行业特定的词性标注
  不仅需要不同的模型,而且额外的词性标注也被用于医疗行业的模型。之所以这样做是因为它确实提高了医学命名实体识别的准确性。
  3)医疗行业特定正规化算法
  在实际项目里,命名实体识别自己一般是无用的。从“双眼似乎被感染”里识别“眼睛”和“感染”是医学术语并没有多大用处。
  相反,根据标准SNOMEDCT临床术语将整个文本块标记为代码312132001,同时针对用不同方式对描述相同发现进行正规化则更加有用。这使你的应用能基于此代码来构建业务逻辑,而不管它是如何正规化的,或者更确切地说,不管它是如何在原来的文本中被表达的。
  3。从数据标注开始构建项目
  构建一个AI系统有一种方法是从构建标注验证数据集。例如,如果你对自动化门诊病例成ICD10编码感兴趣,请让临床医生定义一些代表性样本,对样本进行脱敏,并让专业的临床编码人员对其进行标注(分配正确的代码)。
  如果你有兴趣从放射学报告中提取关键事件或从患者病例中找出被忽视的安全事件,请首先让临床医生定义一些样本,并正确标注。
  题外话:你们就会看到各种AI大公司的JD有数据标注师这么一说,标注师的薪资范围比较大,要看行业领域的门槛,比如:医疗行业的会薪资会比较高,也有大部分是兼职的。
  这样做通常会在让数据科学团队加入(并浪费很多时间)前提前发现一些“坑”。如果你无法获得足够的数据,或者无法大规模地进行脱敏,那就无法构建可靠的模型。
  如果在某些情况下临床医生不能一致同意正确的标注,那么要解决的第一个问题是就临床指南达成一致,而不是让数据科学家参与尝试去自动化这种不一致。
  最后,如果你发现自己面临非常不平衡的类别(比如你寻找的是每年只有少数人患病的情况),那么在引入数据科学家之前修改问题的定义可能是明智之举。
  标注的验证集以及数据集其目标是使用标准库或云服务来发现它们能达到的满足用户特定需求的最高准确度。
  这样做就可以评估下面每项服务的难易程度,包括:训练自定义的模型、定义领域专有的特征、解决方案所需的pipeline步骤和把结果解释给客户。
  一旦有了一个有代表性的和已商定并正确标注的验证集,你就可以开始用它来测试现有的库和云服务提供商的服务了。很可能的是,这个测试将立即发现每个产品与你的需求之间的差距。
  六、总结
  我在本文中,是从对医疗业务框架的拆解出发,对NLP定制型医疗服务各方面的产品设计要点做了简要介绍。
  在未来一段时间内,业务定制NLP系统将仍是真正能帮助大型智慧医疗行业达成业务目标的重要系统之一,也是AI落地的主战场之一。
投诉 评论

三步法完成AI产品需求分析笔者通过分析ToB图像类AI产品的需求,阐释了自己的工作经验所得。笔者希望能和大家一起探讨如何完成ToB图像类AI产品的需求分析,文中内容仅表示笔者在实际工作中的产品需求……智能家居全景本篇文章,笔者对智能家居一一梳理分析,带我们了解智能家居全景。2014年是智能家居元年,但目前85人还是不知道智能家居的概念,应该包含哪些设备功能。现在技术也是处于初级阶……VR时代的媒介:真实与虚拟,现实与幻象笔者回顾了历史上的各种媒介,从书本、报纸、广播、电视、电脑到手机,分析总结了各自的传播讯息并畅想了VR时代的场景。自上个世纪传播大师麦克卢汉提出媒介即讯息的观点,启发人们……移动时代,AI如何进行财富管理?笔者结合实际工作经验,描述了移动时代AI财富管理的阶段特征和服务路径。未来,AI财富管理将会逐渐实现融合生活的开放式服务。望各位读者读文先知,本文以工作中产品的实际应用经……基于NLG算法的智慧医疗:应用场景和构建经验在未来一段时间内,业务定制NLP系统将仍是真正能帮助大型智慧医疗行业达成业务目标的重要系统之一,也是AI落地的主战场之一。人工智能正处于非常火热的时期,自然语言处理(NL……AI奇点临近?手机即将终局,5G混战再起,AI已然来临。纵使5G兵临城下、AI狼来了,第六届互联网大会来得依旧没有第七届军运会惊心动魄。当然,在普罗大众心中活在当下确实有可能比预……AI医疗场景化业务:如何用AI技术做食管癌识别和辅助诊断?AI运用于医疗,通过机器学习的特点,可以辅助诊断。笔者分享了运用AI技术做食道癌识别和辅助诊断的经历,阐释了各阶段的难点。影辅助诊断主要做两件事情:医学知识图谱构建……智能家居生活是什么样的?一篇文章带你了解一个个智能家居单品的组合,最终构建成家居智能生态闭环。本篇文章,笔者对智能家居一一梳理分析,带我们了解智能家居全景。晚上一回家推开门,从过道到客厅的灯渐次亮起,窗帘自动合……当AI开始拥有“潜意识”,我们还有隐私吗?AI会影响人们的隐私吗?文章对这个问题从算法和方面进行了分析与讨论,供大家参考。好久没有跟大家聊聊算法方面的新研究了。理由当然不是学术领域没有新闻,毕竟顶会们收到的论文也……AI也有偏见:你在机器“眼里”是好人还是坏蛋?人工智能是从人类身上学习的,而人类是有偏见的生物。近日,麻省理工的博士生在两项独立研究中发现,虽然机器擅长识别人工智能生成的文本,但是很难分辨其中的真假。原因在于训练机器……AI产品经理的进阶路线图AI产品经理区别于普通产品经理的地方,不止在懂得AI算法,更重要的是具有AI思维。人工智能产品设计要以操作极度简单为标准,但是前端的简单代表后端的复杂,系统越复杂,才能越……AI面试官来临,教你三招搞定他你永远不知道你的面试官是人还是人工智能。AI面试官来了,笔者为我们总结了相关的攻略,一起来看看社畜们的演技巅峰,大多数时候不是奉献给了各种甩锅,就是用在了应对面试官身上。……
快手封禁网红殷世航账号称将严查其商品质量又见新号爆单!日销300万,直播涨粉20万,是如何做到的?《武林外传》的15年,也是传统情景喜剧衰落的15年?快手宣布封禁网红殷世航:涉及炒作卖货、低俗演戏B站获手机视频定制弹幕专利授权视频号公会开放申请,到底要不要加入?这些利弊越早知道越好!阿里推出“吃货笔记”打造全新的种草平台旅行十年走遍世界的侣行,如何涨粉千万,在短视频赛道再火一把?送网红去选秀,是个好生意?夜听这场点赞超2000万的视频号直播,9小时内卖了1026万全球首个手语AI合成主播“小聪”发布网友:朱广权狂喜快手游戏发布首款自研手游《西行纪燃魂》为动漫改编男人娶了这丰满的女人容易享福膝关节疼痛指南髌股关节综合症如何申请稳岗补贴,什么样的企业能获得补贴呢?文艺范唯美经典说说短语adidaseqtcushionadv亚洲限量款国内发售店铺怎么保存香水不易挥发让香水持香时间更久的小窍门两碗牛肉面五年级作文小孩不听话老是哭怎么办孩子爱哭不听话怎么办死亡物质最新实机演示公布后启示录开放世界你知道吗,90的痛苦和情绪都是想出来的挽留感人的话吃自己瓜上瘾?陈翔频卖惨反被说渣,赵露思主动cue绿茶戏太多

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界