中科院超级计算青岛分中心muscle安装手册

安装目录: 
/public/bio_app/muscle3.7
软件介绍: 

MUSCLE(Multiple Protein Sequence Alignment)是一款蛋白质水平多序列比对的软件,在速度和精度上都优于 ClustalW。在进行多序列比对的时候,大多数情况下可以优先使用 MUSCLE。

算法:MUSCLE 先使用渐进式比对(progressive alignment)获得初始的多序列比对,再使用横向
精炼(horizontal refinement)迭代提高多序列比对结果。 
   1)使用数串(k-mer  counting)方法构造序列间的全局比对和局部相似度 
   2)填充序列间距离的三角矩阵 
   3)使用 UPGMA 或 NJ 法构建序列发生树,并确定无根树的根 
   4)从叶节点开始向上推测父节点的渐进式比对,最后产生根节点的多序列比对 
   5)根据得到的多序列比对,计算任两序列间的相似度 
   6)计算 Kimura 距离矩阵,构建发生树 
   7)比较新生成的树和原来树的差异,如果有节点的重排,跳转到步骤 4 
   8)从树上砍断一个枝,产生两个子树,每次砍断的位置是按和根的距离降序排列的 
   9)分别计算两个子树的多序列比对,并对两个结果比对得到新的多序列比对 
  10)如果新的比对结果的 SP 分数(sum of pairs)降低,保留这个新的比对结果,反之 
  丢弃。反复迭代 8->9->10,直到分值不再降低或达到最大迭代次数

MUSCLE 使用起来十分方便,大多数情况下用户只需要指定输入输出文件即可 
$ muscle -in <input_file(fasta)> -out <output_file(default fasta)>

安装步骤: 

安装:
下载源码:http://www.drive5.com/muscle/downloads3.7/muscle3.7_src.tar.gz
解压:tar xvf muscle3.7_src.tar.gz
命令行下:make 回车
将生成一个muscle的可执行文件,这就是muscle,将他放在/usr/bin或者/usr/local/bin等文件夹里面,或做成软连接都可以。

使用:
muscle -in seqs.fa -out seqs.afa
更常用的是:
muscle -in seqs.fa -clwout seqs.aln
这将生成与CLUSTALW一样的结果文件。