手记

Qiime1-6.生成OTU表(基于RDP)

一共有三种生成OTU的方法(De novo,Closed-reference,Open-reference),我们通常使用open-reference OTU picking的方法。

De novo OTU picking

De novo选取OTU的方法顾名思义,就是没有任何参考序列进行聚类生成OTU。
优点:所有的reads都可以被聚类
缺点:速度慢

pick_de_novo_otus.py \-i seq.fna \-o pick_otus \

Closed-reference OTU picking

Closed-reference选取OTU的方法是将reads聚类后与参考序列比对,与参考序列无法匹配的reads将被剔除。

优点:速度快;可以建立更好的树和分类
缺点:无法发现新的OTU

pick_closed_reference_otus.py \ -i seq.fna \-r refseqs.fna \-o pick_otus

Open-reference OTU picking

Open-reference选取OTU的方法是先将reads聚类后与参考序列比对,然后未匹配上的序列进行de novo聚类。

优点:所有的序列都被聚类;速度比de novo快
缺点:如果数据大部分都无法匹配到参考序列,则速度仍比较慢。

参数文件16S_pickotu_param.txt内容:
pick_otus:enable_rev_strand_match True
assign_taxonomy:assignment_method rdp
assign_taxonomy:confidence 0.5

pick_open_reference_otus.py \-i seq.fna \-o pick_otus \-p 16S_pickotu_param.txt \

其他的参数,大家可以使用-h查看。根据需求修改。

生成文件

最后会生成一个log文件详细记录命令的子程序脚本。可以查看、记录具体使用了哪些参数和命令。
后续进行下游分析的文件为

  1. OTU Table(pick_otus/otu_table_mc2_w_tax_no_pynast_failures.biom)

  2. Phylogenetic Tree (pick_otus/rep_set.tre)

  3. Representative Sequences (pick_otus/rep_set.fna)

RDP步骤报错

如果没有安装RDP分类器会出现下述报错:
Error in assign_taxonomy.py: RDP classifier is not installed or not accessible to QIIME. See install instructions here: http://qiime.org/install/install.html#rdp-install
打开提示的网站http://qiime.org/install/install.html#rdp-install
点击next下一页(http://qiime.org/install/alternative.html)会出现RDP安装的教程。
首先下载RDP分类器:https://sourceforge.net/projects/rdp-classifier/files/rdp-classifier/rdp_classifier_2.2.zip/download

RDP

解压缩后放到合适的位置。

解压后文件夹内文件

然后根据自己放置的位置添加路径。

echo "export RDP_JAR_PATH=$HOME/rdp_classifier_2.2/rdp_classifier-2.2.jar" >> $HOME/.bashrcsource $HOME/.bashrc

再执行的时候就不会报错啦。



作者:jlyq617
链接:https://www.jianshu.com/p/ccfc4707107c


0人推荐
随时随地看视频
慕课网APP