一、cellranger h5
Cell Ranger的结果会转储为多个H5文件,这些文件包含了一些基本的计数器集合,如reads到基因,错误纠正的reads等。H5文件同时可以存储附加的质量信息,这些信息可以在web浏览器中通过Loupe浏览器进行查看。
以下是使用cellranger count生成的一个H5文件的示例:
#!/bin/bash cellranger count --id=tiny_bcl --fastqs=tiny-bcl --sample=pbmc3k --localcores=8 --localmem=32
在这个示例中,小样本的快速文件tiny-bcl被描述为一些人口(pbmc3k),运行与Numpy的计数分析,最终得到了一个包含计数的H5文件。
二、cell ranger软件
Cell Ranger是由10x Genomics制造和提供的一个数据分析软件包,它主要用于处理单细胞RNA数据,使批处理的RNA测序结果变得更为简单。它可以通过集成用户所插入的参考基因组,自动建立一个Genome Browser。
以下是一个使用cellranger count运行的例子,它重复地进行了一个简单的计数运算,然后创造了一个基于UCSC站点的Genome Browser。
#!/bin/bash cellranger count --id=sample3456 --transcriptome=refdata-cellranger-GRCh38-3.0.0 --fastqs=/path/to/sample3456_fastq --sample=sample3456
在这个示例中,“sample3456”和一些与之相关的,非常基本的参数们(像fastq文件路径,参考束)是用来确定单元素件的RNA表达情况。
三、cellranger翻译
Cell Ranger翻译为“细胞游骑兵”,让人想起细胞类别的划分。
在10x Genomics发明Single Cell技术之前,关于单细胞RNA测序分析的方法大多需要在细胞之间手工划分,意味着不可避免的人为偏差效应。通过这种方法,每次测序都只能同时测量一种化合物,所以在有限的时间和存在高噪音的数据中创建准确的图像会非常困难。
单细胞RNA-seq技术被称为是能够揭示复杂转录组拓扑学、发现新的细胞类型和强化转录谱定量的一种有力工具。
四、cellranger结果解读
Cell Ranger的结果解释很复杂,因为它既有模拟的数据,又有实时数据。管理这些不同类型的数据的最佳方式是使用10x Genomics提供的解释材料,有关于每个结果文件及其在单元素件DNA表达研究中的更广泛上下文背景的详细文档。
以下内容是关于特定结果文件(例如,feature-counts.csv文件)的解释:
id,gene,SRR3509631,SRR3509632,SRR3509633,SRR3509634,SRR3509635,SRR3509636,SRR3509637 "SGIP1","ENSG00000184196",47,55,33,46,64,45,63 "MBOAT1","ENSG00000163405",66,71,57,57,86,91,51
这个示例结果的文件告诉我们,SGIP1和MBOAT1是两种最具表达率的基因,而他们的总和分别是每个单元素件中可观测数据计数的一部分。根据这个计数,得到的表格可以分为两列,其中一列存储于“feature-counts.csv”文件中的观察值数据,而另一列则跟每个对应样本相关(像SRR3509631),假设其单元素件DNA表达研究中的更广泛上下文。
五、cellranger官网
Cellranger官网
https://support.10xgenomics.com/single-cell-gene-expression/software/home
该网站是10x Genomics’support网站,提供了各种文档、工具和技术推荐,可以帮助用户和终端用户设定特定的参数以确保研究结果。
六、cellranger分析
Cell Ranger的结果可以直接输入到10x Genomics Loupe浏览器中进行可视化分析。
以下是为了查看一个简单的单元素件中各种基因情况,从浏览器调入Cell Ranger运行的结果的出示的代码段:
cellranger aggr --id=pbmc_10k_aggr \ --csv=/opt/sample-sheet.csv \ --normalize=mapped cellranger loupe \ --id=pbmc_10k_loupe \ --aggregate=pbmc_10k_aggr \ --index=pbmc_10k/aggr/index.csv \ --features=pbmc_10k/web_summary.html \ --mapping=h5 \ --enable-cache
七、什么数据能用cellranger分析
Cell Ranger主要用于处理单细胞测序,重点处理基因差异表达分析和聚类分析。在单细胞RNA测序分析中,分析结果主要来自于fastq文件,这些文件包含有关测序的图像和数据信息,可以通过高级引擎供计算机分析使用。这种数据可以用Cellranger进行处理和分析。
除此之外,其他类型的RNA测序数据都可以进行类似的处理和分析,一般是把这些数据建立成通量表达(expression matrix),然后通过标准的生物信息学流程来进行下一步分析。
八、cellranger原理
在单细胞RNA-seq中,最终的目标是了解在一个细胞中有哪些RNA类别以及这些RNA的相对表达量。识别这些RNA所属的位置就需要遗传学方法来分实现。Cell Ranger就执行了这样的功能,并可以处理和分析单细胞RNA-seq的大量数据。
本质上,cellranger其实是将fastq文件转换为可读的可分析的图像和数据信息,然后将这些数据传递给一些Matlab、Python或其他软件的计算引擎,然后制定标准的生物信息学流程,最终生成有关RNA测序数据的报告和概述,这些报告和概述通常都可以在命令行中进行解释和展示。
九、cellranger使用
使用Cell Ranger首先需要安装,安装十分简单,只要该用户具备下一步所示的几个条件:
- macOS或Linux
- 8个CPU
- 50GB可用磁盘空间
- 64位操作系统
- Python 2.7.x或3.4.x
在安装过程中,可以在Linux或Mac终端上运行十分简单的代码,如下所示:
curl -O https://cf.10xgenomics.com/misc/cell-ranger-5.0.1.tar.gz tar -xzvf cell-ranger-5.0.1.tar.gz
在安装好之后,使用Cell Ranger只需要输入相关命令,如以下例子所示:
cellranger mkfastq --id=tiny-bcl --run=tiny-bcl cellranger count --id=tiny-count --fastqs=tiny-bcl --sample=pbmc3k --localcores=8 --localmem=32
以上示例代码将fastq文件tiny-bcl转换成一个可分析的数据并创建一个ID为“tiny-count”的输出目录,里面包含了界面数据和序列统计信息。