您现在的位置: 灯心草 > 灯心草产地 > 正文 > 正文

使用immunarch包进行单细胞免疫组

  • 来源:本站原创
  • 时间:2021/10/1 18:06:02
简介:

immunarch包是一个主要面向于医学科学家和生物信息学家们设计的,专门针对T细胞受体(TCR)和B细胞受体(BCR)免疫组库数据进行分析的R包。使用immunarch包,使得免疫组库测序数据的分析变的尽可能轻松,并帮助您专注于研究而非编程。

为什么使用immunarch?可以分析处理任何类型的免疫组库数据:single-cell、bulk、datatables、databases--随心所欲。以社区为核心:在全球近30,名研究人员和医学科学家组成的社区中提出问题、分享知识并茁壮成长。辉瑞、诺华、再生元、斯坦福、加州大学旧金山分校和麻省理工学院都信任我们。一行代码一张图:用8行代码写一篇完整的博士论文或用5-10行immunarch代码复制出几乎所有出版物中的图表。站在科学的前沿:我们会定期更新immunarch 的方法。让我们知道你需要什么!自动检测和解析所有流行的免疫测序格式:从MiXCR和ImmunoSEQ到10XGenomics和ArcherDX。特征:

快速简便地操作免疫组库数据:

immuarch包会自动检测您的文件格式——无需再猜测该文件是什么格式,只需将它们传递给包即可;支持所有流行的TCR和BCR数据分析格式,包括单细胞数据:ImmunoSEQ、IMGT、MiTCR、MiXCR、MiGEC、MigMap、VDJtools、tcR、AIRR、10XGenomics、ArcherDX。未来还会有更多;适用于您所熟悉的任何数据源:Rdataframes,datatablesfromdata.table,databaseslikeMonetDB,ApacheSparkdataframesviasparklyr教程可在此处获得。

使得免疫组库数据分析变得简单:

大多数分析方法都包含在几个具有明确命名的主要函数中——不用再去记住数十个名称晦涩的函数。详情见链接;克隆库重叠分析(Repertoireoverlapanalysis)(常用指标包括重叠系数、Jaccard指数和Morisita重叠指数)。教程可在此处获得;TCR/BCR基因使用估计(Geneusageestimation)(相关性、Jensen-ShannonDivergence、聚类)。教程可以在这里找到;克隆多样性评价(Diversityevaluation)(生态多样性指数、基尼指数、逆辛普森指数、稀疏分析)。教程可以在这里找到;跨时间点克隆型追踪(Trackingofclonotypesacrosstimepoints),广泛用于疫苗接种和癌症免疫学领域。教程可以在这里找到;Kmer分布测量和统计(Kmerdistributionmeasuresandstatistics)。教程可以在这里找到;即将发布的下一个版本:CDR3 酸序列理化特性评估、突变网络。

带有丰富的用于可视化操作的内置工具:

丰富的ggplot2可视化程序;内置工具FixVis使您可以交互式操作可视化:使用清晰的GUI轻松更改字体大小、文本角度、标题、图例等;教程可在此处获得。Immunarch包的安装

可以直接在CRAN上安装,或者通过GitHub安装 或的开发版本。

LatestreleaseonCRAN

install.packages("immunarch")LatestreleaseonGitHub

install.packages("devtools")#skipthisifyoualreadyinstalleddevtoolsdevtools::install_github("immunomind/immunarch")Latestpre-releaseonGitHub

install.packages("devtools")#skipthisifyoualreadyinstalleddevtoolsdevtools::install_github("immunomind/immunarch",ref="dev")快速开始

接下来,我们将使用immunarch包内置的测试数据集进行演示TCR或BCR的数据分析工作流程。

1)加载包和示例数据

#加载所需的包和数据集library(immunarch)#LoadthepackageintoRdata(immdata)#Loadthetestdataset#查看示例数据names(immdata)#[1]"data""meta"names(immdata$data)#[1]"A2-i""A2-i""A2-i""A2-i""A4-i""A4-i""MS1""MS2""MS3"#[10]"MS4""MS5""MS6"head(immdata$data$`A2-i`)##Atibble:6x15#ClonesProportionCDR3.ntCDR3.aaV.nameD.nameJ.nameV.endD.startD.endJ.startVJ.ins#dbldblchrchrchrchrchrintintintintdbl#.TGCGCC…CASSQE…TRBV4…TRBD1TRBJ2…-1#.0TGCGCC…CASSYR…TRBV4…TRBD1TRBJ2…11822-1#.TGTGCC…CATSTN…TRBV15TRBD1TRBJ2…-1#.TGTGCC…CATSIG…TRBV15TRBD2TRBJ2…11526-1#.TGTGCC…CASSPW…TRBV27TRBD1TRBJ1…-1#.TGCGCC…CASQGD…TRBV4…TRBD1TRBJ1…8923-1#…with3morevariables:VD.insdbl,DJ.insdbl,Sequencelglnames(immdata$data$`A2-i`)#[1]"Clones""Proportion""CDR3.nt""CDR3.aa""V.name""D.name""J.name"#[8]"V.end""D.start""D.end""J.start""VJ.ins""VD.ins""DJ.ins"#[15]"Sequence"head(immdata$meta)##Atibble:6x6#SampleIDSexAgeStatusLane#chrchrchrdblchrchr#1A2-iC1M11CA#2A2-iC2M9CA#3A2-iC4M16CA#4A2-iC3F6CA#5A4-iC8F22CB#6A4-iC9F24CB

该示例数据集主要由两部分组成,其中data部分存储了12个样本的TCR或BCR注释信息,meta部分存储了这12个样本的metadata注释信息。其中,data部分存储的每个样本的TCR或BCR注释信息包括以下条目:

“Clones”——条形码(events,UMIs)或reads的计数或数量;“Proportion”——条形码(events,UMIs)或reads的比例;“CDR3.nt”——CDR3核苷酸序列;“CDR3.aa”——CDR3 酸序列;“V.name”——对齐的Variable基因片段的名称;“D.name”——对齐的Diversity基因片段或NA的名称;“J.name”——对齐的Joining基因片段的名称;“V.end”——对齐的V基因片段的 位置(基于1);“D.start”——对齐的D基因片段的D5末端的位置(基于1);“D.end”——对齐的D基因片段的D3末端的位置(基于1);“J.start”——对齐的J基因片段的 个位置(基于1);“VJ.ins”——VJ连接处插入核苷酸(N-核苷酸)的数量(-1用于VDJ重组的受体);“VD.ins”——VD连接处插入核苷酸(N-核苷酸)的数量(-1用于VJ重组的受体);“DJ.ins”——DJ连接处插入核苷酸(N-核苷酸)的数量(-1用于VJ重组的受体);“Sequence”——完整的核苷酸序列。

2)计算和可视化基本统计数据

#可视化CDR3区的序列长度分布repExplore(immdata$data,"lens")%%vis()#VisualisethelengthdistributionofCDR3image.png

#可视化克隆型的相对丰度repClonality(immdata$data,"homeo")%%vis()#Visualisetherelativeabundanceofclonotypesimage.png

3)探索和比较T细胞和B细胞库

#构建不同克隆型之间共享的重叠克隆型热图repOverlap(immdata$data)%%vis()#Buildtheheatmapofpublicclonotypessharedbetweenrepertoiresimage.png

#可视化 个克隆型的V基因分布图geneUsage(immdata$data[[1]])%%vis()#VisualisetheV-genedistributionforthefirstrepertoireimage.png

#可视化克隆型的多样性repDiversity(immdata$data)%%vis(.by="Status",.meta=immdata$meta)#VisualisetheChao1diversityofrepertoires,groupedbythepatientstatusimage.png使用自己的数据

immunarch包可以使用repLoad函数加载读取自己的数据集进行后续的分析,使用repSave函数保存分析的结果,repLoad函数可以自动检测输入文件的格式,我们可以通过?repLoad查看更详细的数据导入信息。

目前,immunarch包可以支持以下免疫组库数据的格式:

"immunarch"-当前的软件工具,以防您忘记它:)"immunoseq"-


本文编辑:佚名
转载请注明出地址  http://www.dengxincaoa.com/dxccd/7851.html
冀ICP备2022001669号

Copyright © 2012-2020 灯心草版权所有



现在时间: