Picrust是一种将16S rRNA测序数据用于生物学样品的功能进行推断的计算机程序。Picrust对物种功能分析非常有效。其可以对菌群元组进行功能预测,以便更好地了解群体对于生命的贡献,从而推断它们的功能特性。
一、Picrust的发音和含义
Picrust名称来源于成语“Piecing together the carbon cycle”。其中,“Piecing”代表了整合菌群物种的功能,“carbon cycle”代表了细菌对于生化循环中不同元素的转换。因此Picrust的功能预测工具,是帮助认识细菌对生命过程中的贡献,并对未知的菌群进行预测的工具。
二、Picrust的功能预测
Picrust的主要功能主要是对细菌进行功能预测。在分析16S rRNA数据时,通常只能鉴定物种的分布和数量,但无法获得某一物种的具体功能。因此,在了解一个菌群的时候,我们需要知道它们在什么样的环境中生长,以及哪些基因和分子参与其中。利用Picrust进行分析后,我们可以获得每一个菌群的遗传种类,并把这些信息与已知的基因信息进行匹配,从而推断该菌群生态角色和代谢功能。
下面是picrust命令的示例:
pick_closed_reference_otus -i otus.fasta -o otu_table.biom -r silva_132_99_16S.fna -t silva_132_99_16S_taxonomy.txt -p pick_otus_params.txt -n 30 -f
三、Picrust的选取功能预测
除了可以使用Picrust对于群体进行功能预测,我们也可以针对单一物种,从其基因组中找到相关的基因和代谢途径。为了实现这一目的,我们可以利用KEGG路径预测功能,以获得有关物种的详细功能信息。Picrust会根据物种的遗传数据和代谢通路等信息,推测物种中包含的各种代谢途径和酶基因的数量。
下面是对于EMBL序列根据feature信息生成预测的代码示例:
&& load_otu_map.py -i path/to/biom_file.biom > path/to/output_file.txt && biom_to_tsv.py -i path/to/biom_file.biom > path/to/output_file.tsv && predict_metagenomes.py -i path/to/output_file.txt -o path/to/output_directory -a 'Metastats' && normalize_by_copy_number.py -i path/to/output_directory/pred_metagenome_unstrat.tsv -o path/to/output_directory/pred_metagenome_unstrat_norm.tsv && path_abundance.py -i path/to/output_directory/pred_metagenome_unstrat_norm.tsv -o path/to/pathway_file.tsv && pathway_description.py -i path/to/pathway_file.tsv -o path/to/output_file/pathway_description.txt && pathway_enrichment.py -i path/to/pathway_file.tsv -f -o path/to/output_directory/all_pathways_enrichment.tsv
四、Picrust的优点和局限性
Picrust的优点在于:可以对16S rRNA序列的物种做出可信的功能特性推理,帮助识别它们以及群体对于生命的功能贡献,提供了物种相对数量,预测群体的功能角色,有各种插件支持,例如功能通路预测和进一步差别分析等。Picrust的局限性在于:只能预测通路/基因的存在,不能预测实际的功能表现,不能检测到水生生物中的pufA和pufM基因。
在进行Picrust分析时,我们需要评估其预测的有关物种的代谢途径和酶基因数量,对于一些特定的群体以及模式菌株,结果仍可能存在一定的误差。因此,在进行分析时,我们需要考虑整个分析流程,同时结合其他分析工具进行分析,从而得到更加准确的结果。
下面是包括两段常用的Picrust命令段:
predict_metagenomes.py -i otus.txt.biom -o picrust_predictionCOPASI functInfer.py -i inputFile.txt -e modelFile.xml --plpver 1 -o outputFile.txt
五、总结
综上所述,Picrust是一款非常有用的协助我们了解菌群功能和特性的预测工具。它可以帮助我们对各种菌群的代谢途径和基因功能进行预测,从而更加深入地了解它们在生态系统中的作用和生命过程的贡献。然而在使用时,我们需要注意该程序的局限性,并结合其他分析工具进行使用,以获得更加准确的结果。