seurat数据集下载

726 阅读2分钟

参考:github.com/satijalab/s…

***SeuratData ***是一种使用 R 的内部包和数据管理系统以Seurat对象的形式分发数据集的机制。它代表了用户访问seurat插图中使用的数据集的一种简单方法。===相当于包管理器

主要的三个命令

install.packages数据集安装

available.packages数据集列表

data数据集加载

安装

SeuratData的安装可以通过devtools完成

devtools::install_github('satijalab/seurat-data')

加载并查看

> library(SeuratData)#查看已经安装过的数据集
── Installed datasets ───────────────────────────────────────────────────────────── SeuratData v0.1.0 ──
✔ cbmc   3.0.0                                           ✔ panc8  3.0.0
✔ ifnb   3.0.0                                           ✔ pbmc3k 3.0.0

───────────────────────────────────────────────── Key ──────────────────────────────────────────────────
✔ Dataset loaded successfully
> AvailableData()#查看所有可用的数据集,其中FALSE表示没有下载,TRUE表示已经下载
                     Dataset Version                                                        Summary species            system ncells                                                            tech         notes Installed InstalledVersion
cbmc.SeuratData         cbmc   3.0.0                   scRNAseq and 13-antibody sequencing of CBMCs   human CBMC (cord blood)   8617                                                        CITE-seq          <NA>      TRUE            3.0.0
hcabm40k.SeuratData hcabm40k   3.0.0 40,000 Cells From the Human Cell Atlas ICA Bone Marrow Dataset   human       bone marrow  40000                                                          10x v2          <NA>     FALSE            3.0.0
ifnb.SeuratData         ifnb   3.0.0                              IFNB-Stimulated and Control PBMCs   human              PBMC  13999                                                          10x v1          <NA>      TRUE            3.0.0
panc8.SeuratData       panc8   3.0.0               Eight Pancreas Datasets Across Five Technologies   human Pancreatic Islets  14892                SMARTSeq2, Fluidigm C1, CelSeq, CelSeq2, inDrops          <NA>      TRUE            3.0.0
pbmc3k.SeuratData     pbmc3k   3.0.0                                     3k PBMCs from 10X Genomics   human              PBMC   2700                                                          10x v1          <NA>      TRUE            3.0.0
pbmcsca.SeuratData   pbmcsca   3.0.0           Broad Institute PBMC Systematic Comparative Analysis   human              PBMC  31021 10x v2, 10x v3, SMARTSeq2, Seq-Well, inDrops, Drop-seq, CelSeq2 HCA benchmark     FALSE            3.0.0
> InstallData("pbmc3k")#下载数据集,因为是外网,所以加载的很慢,有条件的可以下载了读入文件。每个数据集都是一个包。
> data()#加载数据集
> data("pbmc3k")#以加载pbmc3k为例
> pbmc3k #查看pbmc3k的信息
An object of class Seurat
13714 features across 2700 samples within 1 assay
Active assay: RNA (13714 features)
2700个细胞,13714个基因
?pbmc3k#可以查看帮助文档
##以下是帮助文档的内容,他告诉我们如何把数据集读入及转化为seurat对象。===直接复制命令即可。

image.png

if (requireNamespace("Seurat", quietly = TRUE)) 
  url <- 'http://cf.10xgenomics.com/samples/cell-exp/1.1.0/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz'
  curl::curl_download(url = url, destfile = basename(path = url))
  untar(tarfile = basename(path = url))
  pbmc.data <- Seurat::Read10X(data.dir = 'filtered_gene_bc_matrices/hg19/')
  pbmc3k <- Seurat::CreateSeuratObject(counts = pbmc.data, project = 'pbmc3k', min.cells = 3, min.features = 200)

image.png

 citation('ifnb.SeuratData')#可以查询这个数据集是来自于哪篇文献

image.png