免疫系统的适应性一定程度上依赖于免疫细胞受体的多样性,多样性的产生通过基因突变和重组来实现,并使得免疫系统能够在多变的环境中有效识别和应答外来抗原[1]。V(D)J基因重组是产生抗体和B细胞受体(BCR)多样性的核心机制。B细胞通过重组酶激活基因(recombinase activating gene, RAG)介导的DNA片段缺失,对免疫球蛋白(Ig)重链和轻链基因进行重排。随后,B细胞通过活化诱导胞苷脱氨酶(activation-induced cytidine deaminase, AID)催化抗体类别转换重组(class-switch recombination, CSR)和细胞超突变(somatic hypermutation, SHM),进一步增强抗体库的多样性和功能特异性(图1)。
然而,基因组上这种BCR基因的突变和重组过程并不总是精确的,在某些情况下,B或T淋巴细胞中的这些机制失控,会导致基因组不稳定性,进而引发淋巴系统的恶性肿瘤。例如,急性淋巴细胞白血病中经常观察到RAG介导的基因缺失突变[2];弥漫大B细胞淋巴瘤则与AID诱导的体细胞超突变密切相关[3];而在多发性骨髓瘤中,类别转换重组的异常则常是致病因素之一[4]。因此,尽管V(D)J重组、SHM(体细胞超突变)和CSR(类别转换重组)在生成免疫多样性方面至关重要,它们也可能通过不同的机制引发癌症风险。研究SHM和CSR在基因组稳定性中的作用不仅有助于揭示抗体多样性生成的基本机制,还能帮助我们更好地理解这些过程如何在特定条件下失控,导致淋巴系统的恶性肿瘤发生。通过深入研究SHM和CSR的调控机制以及其在正常与病理状态下的区别,开发出新的治疗策略,以减少这些过程引发的脱靶突变风险,最终改善癌症的预防和治疗。
(BCR的多样性)
体细胞超突变(SHM)
体细胞超突变(somatic hypermutation, SHM)是B细胞在成熟过程中,尤其是在生发中心(germinal center, GC)内发生的一种高频率点突变过程。该过程主要集中在免疫球蛋白(Ig)基因的可变区(V区),通过引入高频突变来增强抗体的多样性,以提高抗体对抗原的亲和力和特异性。活化诱导的胞苷脱氨酶(activation-induced cytidine deaminase, AID)是SHM的关键酶,负责将DNA中的胞嘧啶(C)脱氨基为尿嘧啶(U),从而引发突变。[5]
SHM通过改变抗体的抗原结合区,增加了B细胞所产生抗体的多样性。由于在B细胞成熟过程中,B细胞的增殖依赖于其与同源抗原的结合,
类别转换重组(CSR)
B细胞在骨髓中成熟时,通过V(D)J基因重排生成编码抗体重链和轻链的多样化蛋白质,并在细胞表面展示IgM和IgD两种抗体。IgM和IgD的重链mRNA来源于相同的前体,但通过可变剪接机制生成不同的恒定区:IGHM和IGHD。在初始B细胞表面,IgD对B细胞的激活起着关键作用,通常初始B细胞表面的IgD数量多于IgM[5]。
当初始B细胞从骨髓迁移至外周循环后,在未与抗原结合的静息状态下不会分泌抗体。它们必须首先识别并结合特定的同源抗原,并通过辅助性T细胞提供的共刺激信号完成激活。一旦B细胞被激活,它们便开始产生IgM作为初始免疫反应的主力抗体。随着进一步的分化,B细胞能够通过类别转换机制将抗体类型从IgM转换为IgG、IgA或IgE,这一过程由抗体重链的恒定区(Fc段)决定。尽管抗体与抗原结合的可变区(Fab段)保持不变,抗体尾部的变化使其能够执行多种生物学功能,如中和毒素、促进病原体的吞噬、以及激活补体系统。这种结构和功能的多样性是B细胞在体液免疫中高效应对各种病原体的关键因素。
(SHM/CSR示意图)
BCR / scBCR数据分析
目前,有多种软件可用于分析和组装注释B细胞受体(BCR)或单细胞B细胞受体(scBCR),包括IgBLAST、BASIC、BraCer、VDJPuzzle和MiXCR等。其中,IgBLAST和BASIC在BCR组装与注释方面表现良好,但没法直接处理单细胞数据;BraCer在处理长读长数据和评估不同体细胞超突变(SHM)频率时则显示出较好的性能。TRUST4是一个功能强大的工具,能够处理高通量技术(如10x Genomics)生成的BCR数据,同时也支持从转录组数据中组装BCR。尽管MiXCR与TRUST4功能相似,但自v4.0版本后不再提供开源版本,限制了其使用(图3)。随着2019年10x Genomics推出5′免疫谱系解决方案,单细胞RNA表达与配对TCR/BCR测序的联合分析逐渐成为单细胞分析主流。这一发展使得使用cellranger软件进行10x Genomics数据分析变得更加简便,从而推动了单细胞免疫组学研究的进展。[6]
(TCR/BCR分析软件)
体细胞超突变(somatic hypermutation, SHM)和类别转换重组(class-switch recombination, CSR)共同推动了抗体的亲和力成熟和抗体类别的多样化转换,是适应性免疫系统能够产生高亲和力、多功能抗体以应对不同抗原的关键机制。然而,目前能够计算SHM突变频率和推断突变热点的工具仍然较为稀缺。
针对SHM突变频率计算的工具中,Immcantation分析框架中的Shazam是一个重要的选择。Shazam专注于免疫球蛋白(Ig)序列中的体细胞超突变(SHM)分析。它能够量化突变负荷、构建突变靶向模型,并通过BASELINe方法评估抗原驱动的选择压力。此外,Shazam 还提供基于SHM模型的进化距离计算,用于分析克隆关系。该工具为研究抗体亲和力成熟和B细胞进化提供了强大的支持。[7]
此外,sciCSR 也可以计算推断体细胞超突变(SHM)(图四),通过计算单细胞BCR测序(scBCR)数据每个细胞的SHM level,并构建马尔可夫状态模型来推断SHM的动态和方向。sciCSR也是一个用于分析单细胞RNA测序(scRNA-seq)数据中类别转换重组(CSR)的计算方法。通过重新分析scRNA-seq比对数据,sciCSR 能区分B细胞的有效组装的BCR转录本与无效组装的BCR转录本,并构建马尔可夫状态模型来推断CSR的动态变化的方向。在新冠疫苗接种的时间序列数据中,sciCSR 准确预测了后续时间点B细胞受体同型分布,相比传统RNA速率分析,捕捉到了B细胞特有的转变过程。[8]
(sciCSR工具流程)
总结
体细胞超突变(SHM)和类别转换重组(CSR)为研究抗体多样性和B细胞进化提供了丰富的数据资源。单细胞RNA测序(scRNA-seq)和单细胞BCR测序(scBCR-seq)技术的发展使得研究人员能够高通量地获取B细胞的突变信息和抗体类型转换动态。多种分析工具(如Shazam和sciCSR)已被开发用于计算SHM突变频率、推断突变热点以及分析CSR的动态变化。这些工具不仅增强了我们对抗体亲和力成熟和B细胞选择过程的理解,还为揭示这些过程的失控如何在肿瘤发生中发挥作用提供了重要线索。未来,先进的数据分析方法有望进一步提高我们对免疫应答机制的洞察力,并促进针对肿瘤的治疗策略的发展。
参考文献
1 徐航娣,周韧.体细胞超突变与B细胞淋巴瘤[J].国际病理科学与临床杂志,2006(04):313-317.
2 Brady, S.W., Roberts, K.G., Gu, Z. et al. The genomic landscape of pediatric acute lymphoblastic leukemia. Nat Genet 54, 1376–1389 (2022).
3 Liu, M., Bertolazzi, G., Sridhar, S. et al. Spatially-resolved transcriptomics reveal macrophage heterogeneity and prognostic significance in diffuse large B-cell lymphoma. Nat Commun 15, 2113 (2024).
4 Chupp, D.P., Rivera, C.E., Zhou, Y. et al. A humanized mouse that mounts mature class-switched, hypermutated and neutralizing antibody responses. Nat Immunol 25, 1489–1506 (2024).
5 Adaptive immune receptor repertoire analysis. Nat Rev Methods Primers 4, 7 (2024).
6 Irac, S.E., Soon, M.S.F., Borcherding, N. et al. Single-cell immune repertoire analysis. Nat Methods 21, 777–792 (2024)
7 Gupta N T, Vander Heiden J A, Uduman M, et al. Change-O: a toolkit for analyzing large-scale B cell immunoglobulin repertoire sequencing data[J]. Bioinformatics, 2015, 31(20): 3356-3358.
8 Ng J C F, Montamat Garcia G, Stewart A T, et al. sciCSR infers B cell state transition and predicts class-switch recombination dynamics using single-cell transcriptomic data[J]. Nature Methods, 2024, 21(5): 823-834.