范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

生信套路解读教你如何利用机器学习发15文章

  随着大数据时代的带来,机器学习正改变着生物医学的三大领域---临床诊断、精准疗法和健康检测。作为临床研究的新风口---利用机器学习方法构建和验证临床预测模型已经成为炙手可热的研究领域。今天小编给大家分享2022年3月一篇机器学习结合生信的高分文章,由Yiran E. Liu研究团队在Genome Medicine(IF:15.266)杂志上发表题为An 8-gene machine learning model improves clinical prediction of severe dengue progression的研究论文。本篇文章作者分析的数据是公共数据集,总所周知,数据质量直接影响着临床预测模型的建模效果,从这一点来看,利用已有的公共数据集简直就是为没有高质量数据或数据收集成本高的研究人员量身定制啊!话不多说,直接开整!
  一、研究背景
  登革热病毒(DENV)的全球发病率持续上升,局部爆发的频率越来越高。早期识别 SD 进展者并及时给予支持性护理对于降低发病率和死亡率至关重要。世界卫生组织 (WHO) 在 2009 年推出了新的诊断亚分类:无警告标志的登革热 (D)、有警告标志的登革热 (DWS) 和重症登革热 (SD)。目前的研究有基于宿主反应的基因特征和使用临床特征或基因组变异的机器学习模型。然而,由于预测能力不足、缺乏普遍性和/或缺乏简约性,没有一个能够转化为临床实践。因此作者训练了一个 基于8 基因的XGBoost模型来预测 SD 的进展,从而能够降低登革热的发病率、死亡率和医疗保健负担。
  二、结果
  1、鉴定与进展为严重登革热相关的 8 基因组
  作者搜索了截至 2019 年 8 月 1 日的 NCBI 基因表达综合 (GEO) 存储库,通过查询"登革热"获取通过阵列或高通量测序分析感染结果不同的人类登革热患者的血液基因表达的数据集。排除与研究无关的信息,由此确定了11个公开可用的数据集,这些数据集存在生物学、临床和技术异质性。利用这些数据集对365名登革热患者的血液转录组进行了分析,其中 199人的症状不严重, 166人进展为SD,其中作者将单纯性登革热 (DF) 患者分类为"非重症",将登革出血热 (DHF) 或登革休克综合征 (DSS) 患者分类为"SD 进展者"。
  接下来,作者使用MetaIntegrator在数据集上进行了迭代蒙特卡洛采样的多队列分析(图1A),以识别非重症患者和 SD 进展者之间的差异表达基因 (DEG)。 在所有迭代中发现了 25 个具有一致效应大小的显著的差异表达基因(图1B),在这25个基因表达基因中,作者执行了贪婪的前向搜索以确定最具预测性的基因集,由此得到三个上调基因和五个下调基因的 8 基因组(图1C-D)。
  图1 多队列分析确定了八个与发展为 SD 密切相关的基因
  2、构建模型以预测现有队列中的严重登革热进展
  为了建立一个可推广的模型来预测 SD 进展,作者将年龄作为一个混杂变量进行了检查。此外由于许多公共数据集中缺乏样本级别的年龄信息,无法将年龄作为变量包括在内。故作者采用非线性分类器以便更好地学习年龄、基因表达和登革热严重程度之间潜在的复杂关系。
  作者利用这八个基因作为特征训练了 XGBoost 梯度提升树模型。其中LTF、UQCRQ、TGFBR3和RASSF5这四个基因共同对模型预测准确度的相对贡献为72.9%(图2A),结果表明,该模型AUC= 0.891 (95% CI 0.706-1),在Youden阈值下,具有 89.2% (95% CI 84.1–93.8) 的敏感性和 81% (95% CI 75.0–86.7) 的特异性(图2B),这表明基于8 基因组 的XGBoost 模型具有更高的泛化性。但基于8 基因组 的XGBoost 模型应用于不同于模型训练的公共数据集时,其效果不佳,故作者同时评估了基于20 基因组以及 8 基因组 XGBoost 模型。
  图2:基于 8 基因 XGBoost 的模型预测公共数据集中的 SD 进展。
  3、在登革热患者的前瞻性队列中独立验证和与临床警告信号进行比较
  在收集独立性数据阶段,作者前瞻性地在哥伦比亚卡利和布卡拉曼加招募了 377 名 DENV 感染患者,出现 SD 的患者被排除在外。
  首先作者分析了出现临床警告信号预测是SD进展时的准确性。作者在就诊时(即在进展为 SD 之前)收集全血样本,并在整个感染过程中跟踪患者(图3A)。在就诊时临床警告信号预测是SD进展的敏感性为77.3% (95% CI 58.3-94.1),特异性为39.7% (95% CI 34.7-44.9)(图3C)。在成人中,临床警告信号预测是 SD 进展的敏感性和特异性分别为 66.7% 和 45.2%。在儿童中,临床警告信号预测是 SD 进展的敏感性和特异性分别为90.0%和37.1%。
  总的来说,出现临床警告信号预测是SD进展的(阳性预测值)PPV为7.4% (95% CI 4.3-10.9), NPV(阴性预测值)为96.6% (95% CI 93.3-99.3),需要25.4例NNP,其中NNP 被定义为需要检查以准确预测一名患者将进展为 SD 的登革热患者的数量。
  接下来,作者将基于8基因组的XGBoost模型应用到该独立前瞻性队列中,该模型预测随后进展为 SD的AUC 为 0.844(95% CI 0.749-0.938),在 Youden 阈值下,其敏感性为 86.4%(95% CI 68.2-100.0),特异性为 79.7%(95% CI 75.5-83.9),阳性和阴性似然比为 4.3(95% CI 3.2–5.5) 和 0.2 (95% CI 0.01–0.4)(图3C)。与临床警告信号相比,8 基因模型的 PPV 和NPV显著更高,NNP 减少了 80%。8 基因模型的年龄差异无统计学意义(DeLong p = 0.19),相比之下,之前的 20 个基因组在成人中的表现比在儿童中的表现更差(DeLong p = 0.0026)。因此,与临床警告信号相比,8 基因 XGBoost 模型改善了两个年龄组的预测,并且比 20 基因组更具有普遍性。
  此外,鉴于登革热进展快速的性质,作者检查了8 基因模型在疾病过程中的时间表现(图3D-F)。8 基因模型可预测整个疾病过程中收集的样本的随后的 SD,此外,对于SD患者,8 基因模型其进展为 SD 的前三天预测也是准确的。
  最后,作者利用三个公共数据集按照1997年WHO标准分析了8基因模型的性能,模型性能与 1997 年标准相当(AUC = 0.842, 95% CI 0.716-0.968)。
  总的来说,这些结果证明了 8 基因模型的早期预后能力和普遍性,适用于在大型、独立、前瞻性登记的队列中收集的样本。
  图3:基于 8 基因组的 XGBoost 模型在独立的前瞻性登革热队列中预测进展为 SD的效果
  4、临床特征与 8 基因组模型预测概率的关联性
  作者接下来检查了 8 基因组模型预测与相关临床特征之间的关系。8 基因组模型预测的概率在先前接触过 DENV 的患者中显著高于未接触过的患者,但该模型能准确区分了原发性或继发性感染的 SD 进展者。此外,8 基因模型预测与体液积聚呈正相关,但与呕吐、出血、腹痛或肝肿大无关,与峰值丙氨酸转氨酶(ALT)和天冬氨酸转氨酶(AST)呈显著中度正相关,与血小板最低点呈中度负相关。
  5、8 基因组模型对其他病毒感染的普遍性
  作者评估了 8 基因组模型是否也可以预测其他病毒感染的严重程度。作者确定了四个独立的队列,包括 336名感染 SARS-CoV-2、基孔肯雅热、流感或呼吸道合胞病毒 (RSV) 的患者。结果表明,8 基因组模型能区分轻度/中度感染与严重感染 SARS-CoV-2、流感和 RSV,但不能区分基孔肯雅热,说明其在其他病毒感染中可能具有一定的区分能力。
  三、讨论
  作者利用公开可用的登革热数据集中大量的生物学、临床和技术异质性,并确定了一个与 SD 相关的 8 个基因,从中构建了一个基于 XGBoost 的机器学习模型来预测向 SD 的进展。随后在一个大型、独立的前瞻性队列中验证了选定的 8 基因模型,结果表明应用于 SD 之前收集的血液样本,8 基因模型准确地预测了 SD 的进展,包括在早期发热阶段。最后与普遍、非特异性和不够敏感的临床警告信号相比,8 基因模型将 NNP 降低了 80%,证明了转化为用于 SD 预测的即时检测的潜力。
  采用机器学习来预测疾病进展的常规套路可算是被小编总结出来了!常规套路:
  1、找到与疾病进展相关的差异表达基因。
  2、基于差异表达基因采用机器学习的方法构建预测模型。
  3、在独立前瞻性队列或新的数据集中验证模型的准确性。
  4、验证模型的临床效果。
  当然想要突破常规套路,就需要添加一些不同的分析,快快学起来,冲刺高分文章吧!
  版权声明
  本文综来源于生信人,仅用于学术分享,转载请注明出处。

风云财报季PMI连续三个月扩张,茅台狂赚627亿,大消费的春天来了?原标题风云财报季PMI连续三个月扩张,海南启动全岛封关准备,茅台狂赚627亿,大消费的春天来了?大消费板块持续的发力与复苏,茅台豪气分红325亿,更是给大消费市场注入一剂强心剂。柴4月,宁愿少吃猪肉,也别忘记吃这菜,营养又解腻,超级过瘾四月以来,我们刚刚度过了清明节气,终于摆脱阴雨的天气,今天就是好天气,阳光非常充沛,经过雨后的空气非常清新,呼吸都是非常舒服,如果我们自己有时间,可以出门踏青游玩,给自己放松放松。草莓上的小麻点是什么?草莓的吃法都有哪些?草莓上的小麻点是草莓的种子,虽然草莓中主要的营养物质分布在红色的果肉当中,但是草莓上的小麻点中也含有一定的营养物质。食用后可以促进肠胃的蠕动,帮助食物进行消化和吸收,而且还可以在肠情人节约会就画这个芭比甜心妆!芭比甜心妆情人节芭比甜心妆。哈喽大家好呀!今天更新这个超适合情人节约会的芭比甜心妆。这次的妆容重点在眉眼立体度,所以咱们先眼部修容画一个小弧形,稍微这样子带出来一点点让它形成一个大c。然后顺女儿出嫁,中东戴安娜依然貌美如花每当有皇室成员大婚,我们的关注焦点总会落在其中一位或几位参加婚礼的宾客身上。从知名度最高的英国到略显神秘的中东地区,都很难不让人注意。就在上个月,约旦王室的长公主伊曼风光大婚。一袭70后剪完秒变90后的减龄短发年轻化的设计就是很受欢70后剪完秒变90后,年轻和年龄无关,挂耳染短发设计。70后的姐姐,把头发剪短后直接减龄二十岁。你说一下你找到我有什么要头发?帮我剪一下,年轻一点。平时好打理的。你这个头发一直都是药店居然有10块不到的护肤好物?还有人不知道护肤信息差1条视频打破药店护肤信息差,均价不到10,就能让你在变美的路上弯道超车!修护敏感的护肤品太贵了,用上2。5一支的生理盐水,除了晒后湿敷退红,还能够用来缓解鼻炎的不适。瑞德睫毛增长液不管女人什么年纪,都建议尝试一下米杏色,洋气显白,太气质米杏色具有复古的气质和职场的氛围感,无论是作为初春季节的通勤装束,还是打造休闲复古的风格都能转换自如,对于年龄的要求更不高,什么年龄段都可以驾驭,一起来感受一下米杏色衣装的搭配推荐罗伊斯预计和多特续约一年算上所有绩效年薪降低至700万欧根据德国媒体图片报多特蒙德跟队记者JorgWeiler和JonasOrtmann的最新报道,多特队长罗伊斯和球队的这次续约拉扯可能马上就要出结果了。消息源透露,罗伊斯最早在下周,预缺阵G1!李炎哲本赛季禁区命中率63。2排全联盟第三直播吧4月9日讯今晚季后赛12进8的系列赛将正式打响,广州将客场挑战山东。据此前消息,李炎哲因伤缺席G1。李炎哲在第三阶段的表现非常出色他场均可以贡献14。3分,投篮命中率高达65王哲林3312特林布尔25611上海大胜江苏先下一城直播吧4月9日讯CBA季后赛12进8率先开打,常规赛排名第5的上海和第12位的江苏迎来一场对决,江苏本赛季在李楠教练的带领下时隔4年重新杀入到季后赛,他们常规赛擅长抓机会,场均三分
一键关闭个性化推荐,避免算法变算计画里有话用了一段时间后,APP就能猜到你喜欢什么,并且精准推送相关内容随着抖音微信淘宝等APP上线算法关闭键,允许用户在后台一键关闭个性化推荐,这样的情况将迎来改变。算法看不见摸不着,却极李渡酒用沉浸式体验玩出营与销的层次感一一家互联网新业态下开放的酒厂如果说中国白酒第一个现象级案例是江小白,那么第二个非李渡莫属。近年来,白酒行业逐渐进入深度调整期,由过去渠道制胜终端为王的模式转变成消费者为王。越来越油价一直上涨是什么原因?油价大涨是什么原因?最近很多人都在抱怨油价一直在上涨,实在是太贵了,都不敢经常开车了,今年以来,国际油价在突破100美元关口后涨势加速,本周涨幅近20,今年涨幅超过了40,这样的迅猛势头历史罕见。油价温水煮青蛙!特斯拉本月第三次涨价,就今天看到这期文章的标题,没错,特斯拉又涨价了!继三元锂电池全系车型,Model3标续三元锂电池全系涨价之后,特斯拉又把漏网之鱼ModelY标续的涨价给补齐了。根据官网信息显示,Mode春风动力涨6。36,华西证券一个月前给出买入评级今日春风动力(603129)涨6。36,收盘报112。09元。2022年1月25日,华西证券研究员崔琰发布了对春风动力的研报极核AE8正式发布两轮电摩供给驱动,该研报对春风动力给出瑞士银行参与制裁俄罗斯,冻结近一万亿人民币协会主席MarcelRohner就近发出表示,瑞士银行管理的资产总额约为53万亿人民币,但是他拒绝提供受瑞士经济制裁俄罗斯影响被冻结的具体资金数额。他表示,确切的金额晚些时候将会公终于红了的白象,要走鸿星尔克的老路?今年3。15晚会上,曝光了一家名为插旗菜业的蔬菜加工企业,在处理土坑酸菜时,一堆工人抽着烟打赤脚在酸菜上踩来踩去,还被曝出添加剂含量超标2至10倍。很快,外界就发现这家插旗菜业是康保险也能抵扣个税?来看看是什么保险2021年度汇算清缴已经进行了半个月了,很多小伙伴都收到了退税的短信,也有不少小伙伴补税不少,几家欢喜几家愁。今天我们要聊聊很多人不知道的保险抵扣个税,2021年的保险费用也能抵扣能惊艳到你的励志文案1。生如蝼蚁当立鸿鹄之志,命如薄纸应有不屈之心2。少年不惧岁月长,彼方尚有荣光在。3。每个人都有三分钟热度但只要坚持到最后的人才赢者。4。白鸽死在了教堂里乌鸦为耶稣携着玫瑰而我对你你身边的三个人,决定了你的穷富一个人活得怎么样,不要看他穿什么品牌的衣服。一个人活得好不好,不要看他用什么品牌的手机。一个人有钱没钱,不要看他开什么车住多大房子。一个人的贫富指数,全都展现在他的交际圈里。01h一则新闻引发的感慨一个女生把正准备交给老师的8000字毕业论文保存失败,仰天痛哭。看完这个新闻,我很是感慨。隔着屏幕都感到绝望!女生毕业论文保存失败,在宿舍仰天痛哭!腾讯新闻new。qq。comra