尔云间一个专门做科研的团队
原创小果生信果
前言:与复杂疾病相关的遗传因素的研究方法
基于当前流行病学研究的进展及研究热点,小果在这里为大家简单介绍一下关于全基因组关联研究(Genomewideassociationstudy,GWAS)(以下简称GWAS)。全基因组关联研究发展已有二十多年了,研究人员们发现了大量和人类疾病以及其它表型相关联的基因,GWAS是现代遗传学的重要组成部分,推动了孟德尔随机化和多基因风险评分的发展与应用。
基本概念
GWAS是对多个个体在全基因组范围的遗传变异(标记)多态性进行检测,获得基因型,进而将基因型与可观测的性状,即表型,进行群体水平的统计学分析,根据统计量或显著性p值筛选出最有可能影响该性状的遗传变异(标记),挖掘与性状变异相关的基因。
相对于连锁分析的优势
关联定位的相对优势:
分辨率高(单碱基水平)
研究材料来源广泛,可捕获的变异丰富
节省时间
材料选择与群体设计
材料选择的基本原则
1)遗传变异和表型变异丰富
2)群体结构分化不能过于明显(如亚种以上,发生生殖隔离是不能做GWAS的)
样本量
非稀有变异中,对中等变异解释率(10左右)的位点的检测功效要达到80以上时,需要的样本量在400左右。
位点的效应越低,需要的样本量越大。
关联分析的三要素
测定某一群体的表型数据
测量该群体的基因型数据
进行关联计算
实操
作为生信分析里最基础的技能之一,有人花了很大的时间和精力都不能够完成一次GWAS。
小果在这里用最简单的数据和代码跑一遍GWAS,希望能够帮助大家更好的理解GWAS。
数据:测试一组狗全基因组的遗传变异与分类形状(毛皮颜色)之间的关系。
操作系统:Linux
1下...
(全文)