新科学想法 学术文库 学术文献 浏览文献

有读书笔记Performance of criteria for selecting evolutionary models in phylogenetics: a comprehensive study based on simulated datasets

金佳 添加于 2010-11-4 16:17 | 2007 次阅读 | 0 个评论
  •  作 者

    Luo A, Qiao H, Zhang Y, Shi W, Ho SYW, Xu W, Zhang A, Zhu C
  •  摘 要

    Background Explicit evolutionary models are required in maximum-likelihood and Bayesian inference, the two methods that are overwhelmingly used in phylogenetic studies of DNA sequence data. Appropriate selection of nucleotide substitution models is important because the use of incorrect models can mislead phylogenetic inference. To better understand the performance of different model-selection criteria, we used 33,600 simulated data sets to analyse the accuracy, precision, dissimilarity, and biases of the hierarchical likelihood-ratio test, Akaike information criterion, Bayesian information criterion, and decision theory. Results We demonstrate that the Bayesian information criterion and decision theory are the most appropriate model-selection criteria because of their high accuracy and precision. Our results also indicate that in some situations different models are selected by different criteria for the same dataset. Such dissimilarity was the highest between the hierarchical likelihood-ratio test and Akaike information criterion, and lowest between the Bayesian information criterion and decision theory. The hierarchical likelihood-ratio test performed poorly when the true model included a proportion of invariable sites, while the Bayesian information criterion and decision theory generally exhibited similar performance to each other. Conclusions Our results indicate that the Bayesian information criterion and decision theory should be preferred for model selection. Together with model-adequacy tests, accurate model selection will serve to improve the reliability of phylogenetic inference and related analyses.
  •  详细资料

    • 文献种类: Journal Article
    • 期刊名称: BMC Evolutionary Biology
    • 期刊缩写: BMC Evolutionary Biology
    • 期卷页: 2010  10 1 242
    • ISBN: 1471-2148
  • 学科领域 信息系统 » 理论信息学

  • 相关链接 DOI URL 

  •  金佳 的文献笔记  订阅

    分子系统学基础研究取得新进展
    在现代分子系统学研究中,最大似然法和贝叶斯分析是两种文献中最为主要的构建系统发育树 的两种方法。在构建系统发育之前,研究人员一般都需要对比对后的多条基因序列进行最优进化模型选择。目前,通常使用的模型选择软件,如ModelTest 等,其实包含似然比检验(LRT),赤池信息标准(AIC)和贝叶斯信息标准(BIC)等多种选择模型的统计标准。对于研究者来说,具体采用哪种统计标准 最后选出进化模型往往是一个让人困惑的问题。
     
    因此,为了更好的理解不同选择标准的行为特点,从而方便众多研究者的应用,该研究针对广 义时间可逆模型(GTR)中24个基本的模式,共计模拟了33,600个数据。就分层似然比检验(hLRT)、赤池信息标准(AIC)、贝斯信息标准 (BIC)和决定理论(DT)等四种现有的主要标准,分别对这些数据进行模型选择,并继而分析了不同标准的准确性、精确性、差异度和选择偏向性。结果表明 BIC和DT具有较高的准确性和精确性,因此判断它们是目前最佳模型选择标准。另外,结果显示:对于同样的数据不同的选择标准经常选择出不同的最优模型; 其中hLRT和AIC的差异度最高,而BIC和DT之间的差异度则最小。选择偏向性结果表明:当真实模型含不变异位点这一参数时,hLRT的选择准确性较 差;而BIC和DT则总是呈现相似的选择偏向性。总之,研究表明在做模型选择分析时,BIC和DT应该作为首选的统计标准。结合模型适度检验,依据BIC 和DT的选择模型理应能促进分子系统及相关研究的可信性。
     
    该研究主要由中国科学院动物研究所朱朝东博士领导的课题组完成,主要得到了中国科学院农 业办公室项目(KSCX2-YW-NF-02)、国家自然科学基金委项目(30870268, J0930004)资助,并部分得到中国农业部行业科技专项(200803006)、北京市自然科学基金委重点基金(KZ201010028028)等项 目的资助。
     

    研究论文已发表在《BMC进化生物学》(BMC Evolutionary Biology)(SCI影响因子4.29)。该论文自发表以来,已经成为该杂志高度受关注论文之一。目前第一作者罗阿蓉同学,已经得到国家留学基金委资助,前往澳大利亚联邦科工委组织进一步开展博士论文工作,加强在该领域的合作研究。

管理选项: 导出文献|

评论(0 人)

facelist doodle 涂鸦板

Copyright;  © 新科学想法 2016-2017   浙公网安备 33010202000686号   ( 浙ICP备09035230号-1 )