参考:github.com/satijalab/s…
***SeuratData ***是一种使用 R 的内部包和数据管理系统以Seurat对象的形式分发数据集的机制。它代表了用户访问seurat插图中使用的数据集的一种简单方法。===相当于包管理器
主要的三个命令
install.packages数据集安装
available.packages数据集列表
data数据集加载
安装
SeuratData的安装可以通过devtools完成
devtools::install_github('satijalab/seurat-data')
加载并查看
> library(SeuratData)#查看已经安装过的数据集
── Installed datasets ───────────────────────────────────────────────────────────── SeuratData v0.1.0 ──
✔ cbmc 3.0.0 ✔ panc8 3.0.0
✔ ifnb 3.0.0 ✔ pbmc3k 3.0.0
───────────────────────────────────────────────── Key ──────────────────────────────────────────────────
✔ Dataset loaded successfully
> AvailableData()#查看所有可用的数据集,其中FALSE表示没有下载,TRUE表示已经下载
Dataset Version Summary species system ncells tech notes Installed InstalledVersion
cbmc.SeuratData cbmc 3.0.0 scRNAseq and 13-antibody sequencing of CBMCs human CBMC (cord blood) 8617 CITE-seq <NA> TRUE 3.0.0
hcabm40k.SeuratData hcabm40k 3.0.0 40,000 Cells From the Human Cell Atlas ICA Bone Marrow Dataset human bone marrow 40000 10x v2 <NA> FALSE 3.0.0
ifnb.SeuratData ifnb 3.0.0 IFNB-Stimulated and Control PBMCs human PBMC 13999 10x v1 <NA> TRUE 3.0.0
panc8.SeuratData panc8 3.0.0 Eight Pancreas Datasets Across Five Technologies human Pancreatic Islets 14892 SMARTSeq2, Fluidigm C1, CelSeq, CelSeq2, inDrops <NA> TRUE 3.0.0
pbmc3k.SeuratData pbmc3k 3.0.0 3k PBMCs from 10X Genomics human PBMC 2700 10x v1 <NA> TRUE 3.0.0
pbmcsca.SeuratData pbmcsca 3.0.0 Broad Institute PBMC Systematic Comparative Analysis human PBMC 31021 10x v2, 10x v3, SMARTSeq2, Seq-Well, inDrops, Drop-seq, CelSeq2 HCA benchmark FALSE 3.0.0
> InstallData("pbmc3k")#下载数据集,因为是外网,所以加载的很慢,有条件的可以下载了读入文件。每个数据集都是一个包。
> data()#加载数据集
> data("pbmc3k")#以加载pbmc3k为例
> pbmc3k #查看pbmc3k的信息
An object of class Seurat
13714 features across 2700 samples within 1 assay
Active assay: RNA (13714 features)
2700个细胞,13714个基因
?pbmc3k#可以查看帮助文档
##以下是帮助文档的内容,他告诉我们如何把数据集读入及转化为seurat对象。===直接复制命令即可。
if (requireNamespace("Seurat", quietly = TRUE))
url <- 'http://cf.10xgenomics.com/samples/cell-exp/1.1.0/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz'
curl::curl_download(url = url, destfile = basename(path = url))
untar(tarfile = basename(path = url))
pbmc.data <- Seurat::Read10X(data.dir = 'filtered_gene_bc_matrices/hg19/')
pbmc3k <- Seurat::CreateSeuratObject(counts = pbmc.data, project = 'pbmc3k', min.cells = 3, min.features = 200)
citation('ifnb.SeuratData')#可以查询这个数据集是来自于哪篇文献