浅析罗姆人是通过什么方法和材料,将基因检测出来的呢?
文丨麒阁史观编辑丨麒阁史观一、材料和方法的研究依据
为了检测罗姆人的基因,我们收集了27罗马样本 以及四个国家的六组抽样 。
所有的研究都是根据《赫尔辛基宣言 》中所表达的原则进行的。罗姆人自我报告为同一部落至少三代的后代。我们使用Affymetrix 1 M SNP芯片对样本进行基因分型。
我们要求每个SNP的每个样本中有5%的基因型缺失被纳入分析,其中包括27个个体,但有726,404个SNP超过了这个阈值。
这些数据与数据从其他四个来源,包括国际单倍型地图第三阶段(单倍型图),n=1115样本11人口基因型1M数组,CEPH-人类基因组多样性小组(HGDP),n = 257个人51人口500 K SNP数组。
(作者观点)我们之前的研究印度基因变异,我们称之为"印度项目" 在本文中n=25132组基因型1 M SNP阵列和人口参考样本(POPRES),n = 3,来自37个欧洲群体的845个个体在Affymetrix 500 K SNP阵列上进行基因分型。
根据分析结果,我们从这些来源中纳入了不同数量的参考种群。二、种群结构分析与Fst计算
为了研究罗姆人与HapMap群体的关系,我们创建了一个罗姆人和HapMap群体的合并数据集(n = 1,142和726,404个SNPs)。
由于背景LD可以影响PCA和混合分析,我们通过排除50个SNPs的窗口(每次滑动5个窗口)中强LD(成对基因型相关r2 .0.1)中的SNPs,使用PLINK v1.07 细化标记集。
(作者观点)精简的数据集包含61,052个SNPs,我们使用智能pca进行PCA分析并计算FST值,聚类分析则采用混合物进行。
为了研究罗马人与南亚人的关系,我们创建了一个Roma、HapMap、POPRES和HGDP的合并数据集(n = 1,966和205,710个SNPs),并使用包含55,303个SNPs的LD精简数据集进行PCA和混合。人口混合物的正式测试
为了检验罗姆人是否具有西欧亚血统和印度血统,我们使用了无根系统发育树((YRI,CEU),(Onge,Roma)),并计算了所有三个可能与这些种群相关的系统发育树的4个种群检验统计量。
为了进行分析,我们创建了一个罗姆、印度项目和HapMap人群 的合并数据集(n=1274和524053个SNPs)。
让YRIi,CEUi,Ongei和Romai分别为YRI、CEU、Onge和Roma人群中SNP i的等位基因频率。
具体来说,我们计算了整个基因组中所有snp的相关性: r(YRIi-CEUi,Ongei-Romai)。
(作者观点)在没有混合物的情况下,期望的相关性将为0。标准误差使用块折刀计算,在每次运行中删除一个5厘米的块。估计全基因组祖先的比例
我们使用F4比率进行估计,估计了祖先的全基因组比例,该估计方法估计了西欧亚血统比Onge的过剩。我们使用了一种种群关系模型。
并且我们使用混合图对该模型进行了测试,发现该模型与数据很好地拟合,这意味着f-统计量没有一个大于预期的三个标准误差。
F4比值估算计算f4(YRIi、罗马-奥迪)/F4(YRIi、奥迪、CEUi - Ongei)的比值。这个数量包括所有站点(262,558个SNPs),并使用标准误差使用块折刀(块大小为5 cM)计算。
为了表示该分析所需的所有种群,我们创建了一个合并的数据集,其中包括来自罗姆人、印度项目、HGDP和HapMap(n = 1,531和262,558个SNPs)的数据。
我们使用种系检测IBD片段。为了进行分析,我们使用Beagle对所有相关群体的数据进行了分阶段分析。
然后在罗马、HapMap、印度项目、POPRES和HGDP(n = 1,966和205,710个SNPs)的组合数据集上以基因型扩展模式进行种系运行。
我们应用以下参数计算IBD片段:种子大小 = 75,最小IBD片段长度 = 3 cM,杂合子或纯合子错误数 =0。种系的输出用于计算种群I和J之间的平均成对共享。
其中IBDij =为个体i和j之间共享的IBD段长度 ,m分别为种群I和J中的个体数。
为了确定欧洲血统的来源,我们还计算了罗姆人和欧洲四个地理区域之间的平均共享,并对以下样本进行分析。
每组包含以下样本:北欧(n = 595)包括CEU,HGDP拉脱维亚,英国、爱尔兰、瑞典、苏格兰、挪威、丹麦和芬兰POPRES。
南欧(n = 649)包括TSI,意大利、巴斯克、撒丁岛,和托斯卡纳HGDP,和西班牙、克罗地亚、波斯尼亚-黑塞哥维那、阿尔巴尼亚、马其顿、斯洛文尼亚、科索沃、意大利、塞浦路斯、葡萄牙、希腊和塞尔维亚POPRES。
东欧(n = 82)包括俄罗斯HGDP和罗马尼亚、匈牙利、斯洛伐克、捷克共和国、保加利亚、乌克兰、波兰和俄罗斯POPRES,西欧(n = 241)包括来自HGDP的法语和德国、比利时、法国、奥地利和来自POPRES的荷兰。
同样地,为了确定南亚血统的来源,我们计算了罗姆人和南亚人之间的平均IBD距离。
我们分组南亚样本在七个地区类别如下:北(n= 38)包括塔鲁,哈里亚,外氏,斯里瓦斯塔瓦,撒哈拉,罗迪,HGDP帕森和信地。
西北(n = 225)包括克什米尔潘迪特和POPRES旁遮普,东北(n = 8)包括尼和奥那加。
西南(n = 16)包括库伦巴和哈拉基,东南部(n = 29)包括马迪加、奈杜、韦拉马和坎萨利。
西部(n = 32)包括比尔、梅格哈瓦尔和POPRES古吉拉特邦,东部包括桑塔尔和萨塔纳米,安达曼人(n = 16)包括大安达玛和昂格。
我们应用改进的滚动来估计一个包含1,274个个体和524,053个SNPs的组合数据集的混合日期。
对于每一对距离为dmorang的snp(x,y),我们计算(x,y)之间的协方差。具体来说,我们使用以下统计数据。
其中,SNPs(x,y)和权重函数w(x,y)之间的z(x,y)=的协方差是一个权重函数,可以是祖先群体之间的等位基因频率差异,也可以是基于SNPs(PCA的负荷(x,y)。
(作者观点)我们研究加权协方差与遗传距离的关系,并获得一个日期拟合指数函数仿射项y~Ae{ndzc,其中n是代数,d是摩根的距离,c是仿射项(非零的渐近线)和加权LD曲线的振幅(LD在短距离)。
标准误差计算使用加权块折刀,在每次运行中删除一条染色体。我们用指数函数拟合一个指数和来估计双脉冲混合模型下的混合日期: y~Ae{n1dzBe{n2dzc,其中n1,n2为几代的混合日期。估计个体的自合子度
我们使用PLINK v1.07,在一个包含1,274个个体和524,053个SNPs的组合数据集中,识别了基因组中的自合子片段。
PLINK使用滑动窗口方法来寻找长度至少为1 MB且包含100个连续的纯合子snp的基因组区域。我们允许每个片段有一个杂合子和五个缺失的呼叫。
对每个个体分别鉴定自合子片段。我们应用这种方法来计算每个罗马人和每个HapMap群体中的30个随机个体的基因组自合子度,这个长度为自合子片段的总长度。
为了推断创始人事件的日期,我们使用包含罗马和HapMap群体的数据集(n=1,142和7264,404个snp)计算等位基因共享的相关性作为LD的度量。
具体来说,我们计算成对Roma个体之间等位基因共享的自相关,然后减去(Roma,CEU)跨群体自相关,以消除祖先等位基因共享的影响。
(作者观点)因此,我们得到了一个与该组中等位基因共享过量相关的罗马特异性LD的测量方法。我们绘制了与遗传距离的自相关图来推断创始人事件的时间。
具体地说,我们拟合了指数函数: y~Ae{2tDzc,其中摩根事件中的D=距离和创始人事件的t=时间。
为了研究罗姆人与全球人群的关系,我们进行了混合分析。每条竖线代表一个基于每个集群的估计祖先的比例的个体颜色。
罗马人群和HapMap人群的(a)混合分析(K = 2到K = 7)。K = 6的交叉验证误差最低;(b)对罗马人、欧洲人(CEU)和南亚人的混合分析。
K=3的交叉验证误差最低,所以我们将所有组(罗姆人除外)的样本量限制在20人以内 。
为了估计西欧亚血统在罗马人中的比例,我们使用了系统发育树,不同颜色的线显示了由这条线连接的种群之间发生的漂移。
橙色的线表示YRI和Adygei之间的漂移,红色和绿色的线表示罗马和Onge之间的漂移。M表示罗马和Onge之间的共同漂移。
这个方法是来自印度(ANI)和欧洲(离开印度后)的罗姆人的西欧亚血统比例(p)的详细估计方法,并且这个数字改编自Reich等人。
我们使用相关(a)或z(x,y)的协方差(b)版本,将平方归一化项Pz(x,y)2作为表S3中描述的混合和瓶颈场景,SNPs之间的遗传距离d的函数。
在没有瓶颈的情况下,归一化项受有限采样噪声的控制,并不依赖于后的混合。
然而,Pd对于强瓶颈的情况下z(x,y)2展品一个指数衰减Ae{2kdzc速率常数大约等于两倍的年龄的瓶颈,(a)最佳适合k = 15、25、46、65、83和(b) =12、20、41、60、78显示为实线。参考文献:
《基因编辑技术:进展与挑战》
《基因编辑的伦理争议》
葛兰素史克被国家集采拉黑18个月11月财经新势力相比于集采断供商业贿赂,对质量问题的处罚力度显然更高文辛颖赵天宇编王小图Pixabay跨国药企葛兰素史克(GSK),被暂停参与国家组织药品集中采购18个月,成为自有
多款降价iPhone现货被抢空?当日电商平台数据亮眼,在华周销量却遭遇滑铁卢31日晚间,双十一预售正式启动,近期在国内消费遇冷的苹果手机在各大电商平台的销售情况备受市场关注。据媒体报道,10月31日晚8点双十一正式开启,部分热门产品出现卖断货情况。晚8点一
盘点国内近年来发生的踩踏事件,你知道几个?截止小编写稿的时候,韩国梨泰院踩踏事故目前死亡人数达到了156人,这次的事故牵动了全世界人民的心,梨泰院是韩国首都首尔的一个繁华商圈,也是重要的观光地。当天,有约10万的年轻人来这
老年人的福音社区要配建食堂,10月开始试点今日,即10月31日,住建部民政部联合发布了关于开展完整社区建设试点工作的通知,明确规定完整的社区应该配有食堂。本人半信半疑,还有这等好事?于是又在中华人民共和国中央人民政府网站上
有研硅IPO11月1日开启申购中证网讯(王珞)10月31日下午,有研硅(688432)首次公开发行股票并在科创板上市网上路演顺利举行。公司董事长方永义总经理张果虎等企业领导就企业发展战略投资价值等问题与投资者进
时光前冲书叶留印一本被你遗忘在角落很多年的旧书,它的品相大概就是卷曲了所有的毛边,纸张的两个角上像盖楼一样,规则的折起一个个小三角,年代久远些,书纸就会有些泛黄,如果你凑在鼻子尖儿闻闻会有一股淡淡
回不去的时光我去过很多地方,但是我不喜欢旅游。我曾经梦想着环游世界,但是我觉得一个人似乎太孤独了。做一只在泥地里摇尾巴的乌龟,比来一趟快马加鞭,长途跋涉,尝一点味道,都要快乐。我爬过山,我站在
2022年黄埔区优惠券活动10月28日震撼开启随着11。11预售的大幕开启,一年一度购物狂欢季如期而至。为了进一步激发消费者购物热情,京东携手广州市黄埔区商务局开展魅力黄埔幸福就购2022黄埔区优惠券活动。10月28日至11月
数藏行业乱象丛生数物智游瞄准市场痛点年初的北京冬奥会让可爱的吉祥物火到国外,一墩难求的现象不仅出现在线下实体冰墩墩,奥委会官方授权发行的冰墩墩数字藏品同样刚上线就被抢购一空。除了冰墩墩的大IP因素作怪之外,大家对数字
北京邮电大学对不起,南京邮电大学,两电一邮的邮只能是我一种观点认为,假如南京也有几千家互联网公司,那两电一邮的邮就是南邮了。北京邮电大学不过强在地理位置,要知道,地理位置是决定学校层次很重要的因素,不能忽略南京邮电大学对此观点不敢全部
如何在组织中有效使用低代码工具多年来,低代码工具和平台使人们能够创建有用的软件系统,而无需编写和维护大型自定义代码库赢得了几乎同等数量的倡导者和批评者。有权威机构预测,到2025年,将有多达70的新应用程序会使