您的位置:

clusterProfiler包使用介绍

一、clusterProfiler包全称

clusterProfiler是R语言中的一款生物信息学分析包,主要用于功能富集分析和基因集富集分析。

二、clusterProfiler怎么读

clusterProfiler的读法是“克拉斯特-普罗费勒”。

三、clusterProfiler包介绍

clusterProfiler包依赖于其他几个包,如DOSE和enrichplot等,用于分析大规模基因集的转录数据,可实现KEGG通路分析,维度缩减,维度可视化等功能。该包可以与绝大多数常用基因注释器(如:org.Hs.eg.db、org.Mm.eg.db等)结合使用。

当然,为了方便用户进行分析,官方还额外提供许多基因注释信息和物种信息的包文件,如:DO.db、KEGGREST、ReactomePA、org.At.tair.db等,可在R中直接安装。

四、clusterProfiler包弦图

clusterProfiler包的弦图(Chord Plots)可以用于展示基因组或转录组中不同注释的基因集之间的相互作用情况,强调不同基因集之间的相互作用程度,以及它们之间的关系和交叉。

下面是一个用于KEGG通路分析结果的弦图代码示例:

kegg_enrich <- enrichKEGG(gene     = gene_list,
                          organism = 'mmu',
                          pvalueCutoff = 0.05,
                          qvalueCutoff = 1,
                          readable = TRUE)
kegg_enrichment <- ggplot(plotEnrich(kegg_enrich)) +
                     theme(legend.position = 'right',
                           axis.text = element_text(size = 8)) +
                     scale_fill_brewer(type = 'qual', palette = 6, direction = -1) +
                     ggtitle('KEGG enrichment analysis results') +
                     xlab('') + ylab('')
```
chordDiagram(mergeSig(kegg_enrich, sigLevel = 0.05), 
              sortFun= function(x) -log10(x[,2]), 
              direction = c('clockwise','counterclockwise'))
```

五、clusterProfiler进行GSEA

clusterProfiler的GSEA分析(Gene Set Enrichment Analysis)主要用于基因集在样本中的富集分析,是一个非常常见的生物信息学方法,用于发现功能相似的基因集在生物实验中的重要性。

下面是一个用于GSEA分析的代码示例:

gse_result<-gseGO(gene = gene_list,
                  OrgDb = org.Hs.eg.db,
                  ont = "BP",
                  nPerm = 1000,
                  minGSSize = 10,
                  pvalueCutoff = 0.05,
                  maxSize = 500,
                  verbose = FALSE)
gse_plot<-ggplot(plotGSEA(gse_result,top=20,color = 'blue'),annotation = 'none')+
              theme(legend.position = 'bottom')+
              ggtitle('GSEA analysis results')+
              xlab('')+
              ylab('')+
              guides(colour=guide_legend(nrow=5,byrow=TRUE,title=NULL))
gse_plot

六、clusterProfiler自建库

clusterProfiler还支持自建基因注释信息库,方便用户更便捷的进行分析。

下面是一个自建库的代码示例:

library(AnnotationForge)
sample_species <- 'pombe'
columns <- c( "SYMBOL", "ENTREZID")
orgDb <- makeOrgPackageFromNCBI( 
                  dbname = sample_species, 
                  includeNCBISynonyms=TRUE, 
                  tax_id = as.integer(paste("28", 0, 1, sep = "")), 
                  columns=columns, 
                  version = '1.0.0', 
                  author = 'Your Name', 
                  maintainers = list(
                      maintainer = c("Name", ""),
                      email = "example@gmail.com"),
                  outputDir='~/Downloads'
                  )
以上就是本次clusterProfiler包使用介绍的内容,希望对大家有所帮助。