【论文阅读】ColabFold: making protein folding accessible to all
论文阅读:ColabFold: making protein folding accessible to all (2022)
1、背景
研究问题:这篇文章要解决的问题是如何让蛋白质折叠预测对所有人开放,特别是那些没有强大计算资源的研究人员。
研究难点:该问题的研究难点包括:构建多样化的多序列比对(MSA)需要大量计算资源和存储空间;执行深度神经网络需要高性能的图形处理单元(GPU);现有的解决方案如AlphaFold2和RoseTTAFold虽然准确,但对计算资源要求较高,限制了其在资源有限的研究人员中的应用。
相关工作:相关工作包括AlphaFold2和RoseTTAFold,它们在蛋白质单链和复合物的结构预测中取得了很高的准确性。此外,AlphaFold-multimer是对AlphaFold2的改进,专门用于蛋白质复合物的预测。
2、研究方法
这篇论文提出了ColabFold,一种快速且易于使用的软件,用于在Google Colaboratory或本地计算机上进行蛋白质结构和同聚及异聚复合物的预测。具体来说,
MSA生成:ColabFold使用MMseqs2进行快速的MSA生成,替换了AlphaFold2中的HMMer和HHblits。MMseqs2通过迭代搜索UniRef100和环境的序列集来提高敏感性,并使用新的多样性感知过滤器来限制最终MSA的大小。