【原创】 之前的全基因组关联分析主要采用的是最显著的SNP方法,而忽略了其余的SNP。这种方法存在一些缺点:可能遗漏一些中度效应的SNP,还有那些对于疾病发生起很大作用的SNP也不一定排在最显著的前20-50尤其是样本量很小的时候。本文提出了一种基于通路的挖掘疾病相关SNP的方法,本文是受到基因表达分析中的GSEA方法所启发的,主要是将SNP与基因关联,利用一个基因相关联的所有SNP统计量或者p值进行处理,然后对赋给基因一个值,利用改进的GSEA对从KEGG,BioCarta以及GO中提取的通路做分析,获得与疾病相关的显著通路。并利用以前的全基因组关联数据进行分析,发现以前没有识别的疾病基因以及通路。本文还考虑到了基因大小的影响,并进行了分析。采用基于通路进行分析的方法为疾病相关基因的研究提供了新的视野。 |