深度分析2999名中国人基因,中科院发布女娲数据集中国人专属,填补国际研究空白
IT之家 11 月 28 日消息,遗传变异图谱是研究人群演化史、医学遗传学、基因型-表型关联的基础。此前,大多数全基因组测序相关研究主要集中在欧洲血统人群 。已有研究表明,罕见和低频的变异往往特定于人群或样本,尤其是与疾病相关的变异。针对特定人群的基因组数据可以为全基因组关联研究、区域适应性研究、用药指导等提供更准确的参考。
据中科院生物物理所消息,单倍型参考面板可基于大型人群队列中已知的单倍型信息,对来源于相对稀疏的基因变异芯片或低覆盖率测序样本中缺失的基因型进行推演,是促进全基因组关联研究 (genome-wide association study, GWAS) 有意义且具有成本效益的方法。此前缺乏中国人群特异的参考面板 ,其他参考面板对中国人群特异的变异推演效果较差,从而导致 GWAS 中遗漏潜在的表型相关变异。
中国人群全基因组测序资源和单倍型参考面板的缺乏阻碍了世界上最大人群的遗传学与精准医学研究。为此,中国科学院院士、中科院生物物理研究所研究员徐涛团队,研究员何顺民团队合作,在 Cell Reports 上在线发表了题为 NyuWa Genome Resource: A Deep Whole Genome Sequencing-Based Variation Profile and Reference Panel for the Chinese Population 的文章,介绍该团队关于 "女娲"(NyuWa)中国人群基因组资源库的工作,提供针对中国人群的遗传变异图谱与参考面板基因型推演服务,旨在促进中国人群的遗传学与医学研究。
研究团队分析了 2,999 个中国人的全基因组深度测序数据(26.2X),并以"女娲(NyuWa)"命名 。基于 NyuWa 数据资源,研究构建了包含 7106 万 SNPs 和 819 万 InDels 的中国人群遗传变异图谱(图 1),并对其进行全面注释。
▲图 1.NyuWa 全基因组测序资源的变异数量
相比其它人群队列,NyuWa 数据集包含 2501 万新变异,其中包括 14.9 万非同义变异、10.1 万有害变异、11493 个编码和非编码基因的功能丧失变异、636 个癌症相关基因的蛋白截短变异。大量新变异表明,在以往遗传研究中,中国人群的变异代表性不足,NyuWa 基因组资源则填补了这一空缺 。此外,根据临床相关数据库的注释,研究在 NyuWa 中发现了 1,140 个致病变异,以及药物基因组学相关位点(图 2A)和癌症风险位点(图 2B)上中国人群与世界其他人群的变异频率差异。这些发现有助于中国人群精准医学研究,可能促进新的遗传学和医学进展。
▲图 2.NyuWa 中的药物基因组学位点(A)与癌症风险基因座(B)变异
为汉族人群构建一个完整的、大队列的、高质量的参考面板,对汉族的遗传学与医学研究具有参考价值 。基于 NyuWa 数据资源,科研人员构建了包含 5804 个单倍型和 1926 万变异的单倍型参考面板,其中 325 万变异未包含在其它参考面板中,这些 NyuWa 参考面板特有变异可能会在未来关联研究中带来新发现,是首个数千人级别公开可用的中国人群特异的单倍型参考面板 。
为评估 NyuWa 参考面板的基因型推演性能,科研人员使用来自人类基因组多样性计划(the Human Genome Diversity Project, HGDP)的亚洲各个人群芯片基因分型数据和高覆盖率 WGS 数据作为测试数据集。与其他参考面板相比,NyuWa 参考面板将汉族人群基因型推演的错误率降低了 30%-51% ,在大多数其他东亚和东北亚人群中也有优异表现(图 3A-D)。研究进一步比较了不同等位基因频率的推算结果和实际基因型之间的相关性,NyuWa 参考面板性能在汉族的所有等位基因频率区间中均具有绝对优势(图 3E)。
▲图 3.NyuWa 参考面板对汉族基因型推演具有最佳性能
此外,NyuWa 参考面板与千人基因组 (1KGP3) 面板的结合进一步提高了亚洲人群的基因型推演效果。考虑到南北方汉族遗传差异,科研人员将 NyuWa 参考面板中的样本分为北方和南方子集,使用子集样本分别构建北方和南方汉族的参考面板,通过基因型推演的模拟测试,证明以 NyuWa 的人群规模,一个南北整合的参考面板对中国北方人和南方人均适用(图 4) 。
▲图 4.南北方汉族测试数据集的基因型推演错误率
综上,基于中国人群的大型队列深度 WGS 数据,研究构建了中国人群的遗传变异图谱和首个数千人级别公开可用的中国人群单倍型参考面板,将所有结果整合为中国人群基因组资源库 NyuWa(图 5),有助于中国和亚洲人群的遗传学和精准医学研究 。
▲图 5.NyuWa 资源库
IT之家了解到,当前有关医学基因组学的知识和指南主要来自以欧洲人群为主的遗传和基因组资源,可能遗漏有关非欧洲人群的遗传信息。亚洲人群起源、迁徙和融合历史悠久而复杂,使得其遗传多样性研究面临挑战和机遇。针对中国人群的全基因组测序工作,对于扩充世界人群遗传资源多样性、提高中国人群医学研究准确性十分必要,有助于深入了解亚洲人群结构与人群历史,并对寻找复杂疾病遗传因素的研究设计以及人口健康指导具有参考价值 。
在纳米尺度上捕获和利用光的新的基本极限来自南安普顿大学和苏黎世联邦理工学院的物理学家们在纳米尺度上达到了光物质耦合的一个新门槛。这项国际研究最近发表在自然光子学上,它结合了理论和实验发现,确定了我们限制和利用光的能力的
700年的南极烟尘揭示了人类活动对环境的影响据外媒CNET报道,人们通常认为,随着18世纪工业时代的到来,人类开始对全球环境和气候产生重大影响,但新研究表明,更古老的世界并不像我们认为的那样没有被影响。科学家们在分析南极洲的
毅力号拍摄火星照片显示可能存在外星生命迹象的区域据外媒CNET报道,美国宇航局(NASA)的ldquo毅力号rdquo火星车可能很快就会有一些新的检查点需要探索。地质学家称,在ldquo毅力号rdquo漫游车驻扎的杰泽罗陨石坑附
NASA和欧洲航天局正在研究火星样本带回地球的任务美国宇航局和欧洲航天局(ESA)正在研究火星样本返回任务,该任务将获取由火星毅力号探测器收集并储存在密封管中的火星岩石和其他材料样本,并将密封管送回地球。根据目前的构想,美国宇航局
研究DNA正在成为世界上最微小的硬盘据外媒报道,我们的遗传密码在存储数据方面的效率比现有的解决方案高几百万倍,而现有的解决方案成本非常高且使用大量的能源和空间。事实上,我们可以摆脱硬盘,在几百磅的DNA中储存地球上所
预测地球附近的稀有小行星可能成为太空采矿的目标据外媒CNET报道,科学家们刚刚计算出,漂浮在地球附近的两个金属小行星中的一个可能含有价值约11。65万亿美元的贵金属。事实上,该小行星中所拥有的铁镍和钴可能比地球金属储备的总量还
研究员用温室气体制造燃料未来有望在火星开展生产辛辛那提大学的工程师们已经开发出一种利用温室气体制造燃料的方法。这个过程有可能在地球上和火星上都能创造出燃料。如果这个过程能够得到完善,它可能被证明正是美国国家航空航天局所需要的,
40多年来的首批月球样本可能改变月球历史据外媒CNET报道,2020年年底,中国嫦娥五号月球探测器携带月球样本返回地球,这些珍贵的月球岩石刚刚揭示了关于月球的一个新细节月球上的火山活动可能一直延续到20亿年前,而且很活跃
神舟十三号载人飞船近期择机发射女航天员要驻留6个月北京时间2021年10月7日,神舟十三号载人飞船长征二号F遥十三运载火箭组合体转运至发射区。目前,发射场设施设备状态良好,后续将按计划开展发射前的各项功能检查联合测试等工作,近期择
气候危机对个人和社会产生的焦虑水平正在不断增长据外媒报道,气候危机正在对儿童和年轻人的心理健康造成越来越大的伤害领导人必须现在就采取行动,创造一条通往更快乐和更健康的未来的道路。专家们于今日(当地时间2021年10月6日)在B
研究揭示运动如何直接减缓肿瘤细胞的生长据外媒NewAtlas报道,澳大利亚伊迪斯middot科文大学的研究人员进行了一项小而有力的研究,发现了运动有助于抑制癌症生长的一种方式。该研究发现运动能诱导肌肉释放一种蛋白质,从