CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
靶向二代测序研究进展
作者:周健 师永霞 张璐 戴俊 黄吉城
周健 师永霞 张璐 戴俊 黄吉城
摘 要 近年来,随着核酸分子检测技术进步和费用下降,二代测序(next-generation sequencing technology,NGS)技术已成为生物学及临床医学检测领域的一种重要技术手段。靶向二代测序(targeted next-generation sequencing,tNGS)是在NGS基础上,针对基因组特定区域DNA进行捕获,从而对其进行高通量测序的一种新方法。相较于全基因组或全外显子测序,其优势在于使用基于多重PCR技术或寡核苷酸探针杂交的快速富集方法,针对性富集目的基因进行测序,从而提高测序的平均深度,有效降低测序成本且缩短研究时间,在精准医学、遗传性疾病检测、癌症分析、药物筛选等方面得到了广泛应用。特别是在检测常见临床病原体、遗传性疾病突变、肿瘤突变等方面,tNGS技术的发展和应用正在迅速推进。本文重点介绍tNGS的主要技术路线、研究进展及其应用情况。
关键词 靶向二代测序;研究进展;应用
Research Progress of Targeted Next-generation Sequencing
ZHOU Jian 1 SHI Yong-Xia 1 ZHANG Lu 1 DAI Jun 1 HUANG Ji-Cheng 1*
Abstract In recent years, with the advancement of nucleic acid molecular detection technology and the decline in costs, next-generation sequencing technology (NGS) has become an important technical means in the field of biology and clinical medical testing. Targeted next-generation sequencing (tNGS) is a new method for high-throughput sequencing based on NGS that captures DNA in specific regions of the genome. Compared with whole-genome or whole-exome sequencing, its advantage lies in the use of rapid enrichment methods based on multiplex PCR technology or oligonucleotide probe hybridization, which can specifically enrich target genes for sequencing, thereby increasing the average depth of sequencing. It effectively reduces sequencing costs and shortens research time, and has been widely used in precision medicine, genetic disease detection, cancer analysis and drug screening. In particular, the development and application of tNGS technology is advancing rapidly in the detection of common clinical pathogens, genetic disease mutations and tumor mutations. This article focuses on the main technical routes, research progress and applications of tNGS.
Keywords targeted next-generation sequencing (tNGS); research progress; application
下一代测序(next-generation sequencing,NGS)技术,即第二代测序技术,是为了满足人们对于测序高通量、高灵敏度、高速度、高精度、低成本的需求,从一代测序——Sanger测序法发展而来的新一代测序技术[1]。随着科学技术的发展,二代测序技术逐渐成为基因组学和转录组学研究领域中不可或缺的工具。而在二代测序技术中,宏基因组测序(metagenomic next-generation sequencing,mNGS)和靶向二代测序(targeted next-generation sequencing,tNGS)一直是研究人员使用较多的两种方法。
mNGS是一种用于全面分析DNA/RNA的高通量测序技术,具有高通量、高灵敏度和高分辨率等优点,可以准确检测到传统培养法无法发现的微生物种类。但mNGS测序也存在实验周期长、成本偏高,对于待测样本核酸浓度及基因完整性要求较高,受人源基因干扰,DNA和RNA必须分开检测,特殊病原检出困难,测序数据量大,在临床检测领域存在大量数据浪费的问题[2]。
tNGS是一种通过将靶向富集技术与高通量测序技术相结合发展起来的二代测序技术[3]。通过tNGS技术可以对几十至几百种已知病原微生物及其毒力或者耐药基因进行检测[1],同时通过超多重PCR扩增或杂交捕获,正向富集目标病原基因,相较于mNGS技术,tNGS提升了检测灵敏度,在排除宿主核酸干扰的同时可以对低浓度的病原微生物或者单核苷酸多态性(SNP)位点进行检测[4],且tNGS测序技术所需数据量较低、测序成本低、检测速度快等优点,使其近几年在精准医学、遗传性疾病检测、癌症分析、药物筛选等方面成为mNGS的重要补充乃至替代方案,尤其是在已知特定疾病相关基因或病理学家希望特别关注某些基因变异时,tNGS以其高灵敏性、低成本、较快的检测速度等优点成为mNGS技术绝佳的替代方案。
综上所述,tNGS的关键优势在于高灵敏度、高通量、可定制化和高灵活性[5]。与传统的Sanger测序相比,tNGS不仅可以提高测序深度,还可以更快速地鉴定遗传变异,包括单核苷酸多态性(SNP)、插入/缺失(indel)、拷贝数变异(CNV)等[6]。同时,与同为二代测序的mNGS测序相比,tNGS具有成本更低、测序时间更短、测序数据量更低、操作难度更低、特异性更高的优点[7]。这使得tNGS在临床诊断、基因分型、基因表达谱分析等方面具有广泛应用前景。例如,在癌症研究中,tNGS被用来识别驱动突变和靶向治疗的潜在生物标志物;在遗传病研究中,tNGS有助于快速确定病因基因和预测疾病表型[8]。此外,tNGS还可以用于微生物组分析、表观遗传学研究和功能基因组学等领域。
1 tNGS技术路线及优缺点
现阶段,tNGS技术主要分为两种:基于引物PCR扩增的扩增子测序和基于探针杂交的杂交捕获测序,这两种技术路线各有特点。
1.1 扩增子测序
扩增子测序是一种通过设计特异性靶向目的基因片段的引物进行PCR扩增,以富集目的基因片段的高度靶向测序方式,其仅需少量PCR扩增即可实现对整个基因组或特定基因区段的测序,在缩短文库构建时间的同时,避免了PCR扩增过程中扩增次数增多可能引入的错误。由于该方法的扩增富集过程,扩增子测序可应用于低生物含量标本或被宿主DNA污染的样品,但是引物和PCR循环次数同样也影响扩增子测序的稳定性,可能导致下游分析出现假阳性或假阴性结果。例如,非特异性扩增和偏向性扩增的情况,导致测序结果的偏差,并且富集区域被引物位置限定,当基因组较大或病毒的多态性较高时,设计难度大,而若某一对引物没有正常工作,则可能出现明显的覆盖缺失[9]。
1.2 杂交捕获测序
杂交捕获测序是基于碱基互补配对原理,通过设计寡核苷酸探针,杂交形成复合物再结合高通量测序的技术。可以分为全基因组捕获和目标基因捕获测序,两者在应用方面存在差异,全基因组捕获主要用于拷贝数变异、基因表达路径分析和基因重排等,而目标基因捕获则主要针对突变等研究。杂交捕获的技术核心在于分子杂交,根据技术路线的不同,主要分为液相杂交捕获和固相杂交捕获测序两种。液相杂交捕获是通过将携带有标记,如生物素标记的寡核苷酸探针,与目标片段在液体介质中混合,从而将目的片段结合到探针上,再通过磁珠分选的方式分离出目标片段[10]。固相杂交捕获则是在载玻片上固定探针,然后将目标片段与探针进行杂交,通过洗脱和洗涤的方法捕获目标片段[11]。固相杂交捕获存在成本偏高、操作要求高的问题,因而逐渐被液相杂交测序所取代。相较于扩增子测序,对于DNA的质量要求较低,适用于DNA降解比较严重的样本,能够对几十kb到几百MB的目的区域进行捕获,可适用于大片段的富集,具有更高的检测范围[12]。但是由于杂交前会随机打断样本,探针捕获时可能和目的片段部分杂交,容易导致一些含有部分目标区段的片段被捕获,因此杂交捕获的特异性较差。捕获效率还会受到探针与被捕获样本间遗传距离的影响,随着遗传距离增大,捕获效率会逐渐降低,所以科学家一般通过调整探针设计区域、杂交策略、多套探针混合等策略以提高捕获效率。
作为靶向二代测序的两种主要技术路线,杂交捕获测序和扩增子测序在很多方面具有互补性,分别适用于不同的场景。杂交捕获测序相比扩增子测序更为灵敏,特异性更强,主要用于定向捕获较为复杂的目标序列,特别是在研究大规模且多基因的目标区域、生物进化研究、基因表型研究以及遗传性疾病和罕见疾病方面具有突出优势,例如癌症研究中寻找关键突变和肿瘤驱动基因等。而扩增子测序则主要适用于较小且特定区域的已知序列区域的研究,特别是在环境生物学和临床医学领域具有广泛应用前景,例如物种演化情况或者识别与遗传疾病相关的突变。随着科学技术的发展,以上两种方法将继续在人类健康、生物多样性保护、生态系统研究等领域产生更多的应用可能。例如,利用杂交捕获测序的高灵敏性和高特异性对疾病相关的遗传标记进行测序,预测个体未来可能面临的健康风险,从而采取预防措施,优化健康管理策略;利用扩增子测序对环境DNA(eDNA)进行测序,克服了低拷贝数eDNA样本检测过程中容易出现假阳性及假阳性结果的缺点,助力品种鉴定与物种多样性评估、入侵物种的检测与监控、环境影响评估等方面的研究,促进生物多样性保护、生态系统研究等领域的发展。
2 tNGS研究及应用进展
2.1 癌症诊断和治疗
tNGS在癌症的诊断、疗效监测和个体化治疗方面有着极高的应用价值。可以使用tNGS对一些癌症相关基因进行检测,以识别致病基因突变并指导相应治疗[13],如针对常见的乳腺癌、结直肠癌等。在肿瘤治疗监测方面,tNGS也可以在肿瘤细胞DNA中寻找重要的突变,预测患者肿瘤复发的可能性,监测治疗效果等。例如,通过在不同时间点多次对患者血浆中的游离DNA进行靶向测序,评估患者在分子靶向治疗过程中肿瘤克隆的响应[14]。
2.2 遗传疾病诊断
在遗传疾病诊断领域,tNGS可以直接测序包括疾病基因在内的候选基因区域,以发现疾病相关基因的突变,从而为该疾病的诊断、治疗和预后提供依据[15]。可以用于染色体异常、遗传疾病、罕见疾病等的检测。例如,在糖尿病临床研究中,利用tNGS对1280名志愿者进行单基因糖尿病基因突变检测,可以快速、准确地诊断和预测成年型糖尿病[16]。
2.3 品种鉴定和基因组选择
tNGS也可以用于品种鉴定、相似性分析和基因组选择等相关方面研究,通过对基因组测序分析,发现新品种、提高物种遗传改良的效率和精度[17]。例如,科学家应用tNGS针对水稻起源、分类和驯化进行研究,从而阐明亚洲栽培稻的起源和群体基因组变异结构[18]。
2.4 病原体微生物分型鉴定
基因测序可以帮助识别特定的病毒株/菌株并追踪它们的进化,这对于开发有效的治疗方法和疫苗至关重要[1]。研究人员通过这种技术还能够了解病毒/菌株如何与宿主相互作用,以及它们如何适应不同的环境[19]。通过对病毒/菌株亚型进行检测,基因测序可以提供有关病毒/菌株基因组成的宝贵信息,这有助于病毒感染的诊断和治疗[3]。tNGS为病原体鉴定提供了一种准确且快速、成本低廉的手段。2020年,研究人员针对临床肺泡灌洗液标本开发了一套针对20种常见下呼吸道感染病原体的tNGS检测方法,与培养法相比,具有更高的灵敏性、检测阳性率和病原体覆盖范围,助力临床诊断[20]。
3 结语
在过去的十年里,基因测序技术取得了显著的进展,特别是随着NGS技术的快速发展,不仅极大地促进了生命科学研究的进步,还为诊断和治疗各种疾病提供了新的途径。tNGS作为NGS的一个检测方法,其便捷性与低成本使tNGS在生物信息学、系统生物学、精准医疗等领域展示出巨大的潜力。tNGS改善了临床检测病原体种类多、检测耗时长、检测效率低的问题,提高了传染病疫情监测和防控工作的时效性,临床诊断和传染病防控的需求共同推动了tNGS的迅速发展及应用。目前,国内多家大型医学检测机构均推出了靶向测序技术,在检测市场中占有一定的份额,并呈现逐步扩增趋势。展望未来,tNGS可能会继续改变现有的科研和临床应用范式,为临床医学检测和传染病防控工作作出巨大贡献。
参考文献
[1] Wilkes R P. Next-Generation Diagnostics for Pathogens[J]. Veterinary Clinics: Food Animal Practice, 2023, 39(1): 165-173.
[2] Zheng Y, Qiu X, Wang T, et al. The Diagnostic Value of Metagenomic Next–Generation Sequencing in Lower Respiratory Tract Infection[J]. Frontiers in Cellular and Infection Microbiology, 2021, 11: 694756.
[3] Mitchell SL, Simner P J. Next-generation sequencing in clinical microbiology: are we there yet?[J]. Clinics in laboratory medicine, 2019, 39(3): 405-418.
[4] Smith L D, Bainbridge M N, Parad R B, et al. Second tier molecular genetic testing in newborn screening for pompe disease: landscape and challenges[J]. International journal of neonatal screening, 2020, 6(2): 32.
[5] Li S, Tong J, Liu Y, et al. Targeted next generation sequencing is comparable with metagenomic next generation sequencing in adults with pneumonia for pathogenic microorganism detection[J]. Journal of Infection, 2022, 85(5): e127-e129.
[6] Zhang W, Song J, Tong B, et al. Identification of a novel CNV at the EYA4 gene in a Chinese family with autosomal dominant nonsyndromic hearing loss[J]. BMC Medical Genomics, 2022, 15(1): 113.
[7] Gaston D C, Miller H B, Fissel J A, et al. Evaluation of Metagenomic and Targeted Next-Generation Sequencing Workflows for Detection of Respiratory Pathogens from Bronchoalveolar Lavage Fluid Specimens[J]. Journal of clinical microbiology, 2022, 60(7): e0052622.
[8] La Cognata V, Cavallaro S. A Comprehensive, Targeted NGS Approach to Assessing Molecular Diagnosis of Lysosomal Storage Diseases[J]. Genes, 2021, 12(11): 1750.
[9] Liu Y X, Qin Y, Chen T, et al. A practical guide to amplicon and metagenomic analysis of microbiome data[J]. Protein & cell, 2021, 12(5): 315-330.
[10] De Muinck E J, Trosvik P, Gilfillan G D, et al. A novel ultra high-throughput 16S rRNA gene amplicon sequencing library preparation method for the Illumina HiSeq platform[J]. Microbiome, 2017, 5(1): 1-15.
[11] 贾俊岭, 焦阳, 李然. 一种靶向捕获HLA基因序列并测序的方法: 中国, 201711324536.9[P]. 2019-06-21.
[12] 张圆, 梁丹, 张鹏. 基于混合PCR产物制备捕获探针的基因组捕获方法[J]. Bio-protocol, 2021: e1010599.
[13] Bertucct F, Rypens C, Finetti P, et al. NOTCH and DNA repair pathways are more frequently targeted by genomic alterations in inflammatory than in non-inflammatory breast cancers[J]. Molecular oncology, 2020, 14(3): 504-519.
[14] Filis P, Kyrochristos I, Korakaki E, et al. Longitudinal ctDNA profiling in precision oncology and immuno-oncology[J]. Drug Discovery Today, 2023, 28(4): 103540.
[15] Ploszaj T, Antosik K, Jakiel P, et al. Screening for extremely rare pathogenic variants of monogenic diabetes using targeted panel sequencing[J]. Endocrine, 2021, 73(3): 752-757.
[16] Colclough K, Ellard S, Hattersley A, et al. Syndromic Monogenic Diabetes Genes Should Be Tested in Patients With a Clinical Suspicion of Maturity-Onset Diabetes of the Young[J]. Diabetes, 2021, 71(3): 530-537.
[17] Zhang H, Liu Y, Zong X, et al. Genetic Diversity of Global Faba Bean Germplasm Resources Based on the 130K TNGS Genotyping Platform[J]. Agronomy, 2023, 13(3): 811.
[18] Wang W, Mauleon R, Hu Z, et al. Genomic variation in 3,010 diverse accessions of Asian cultivated rice[J]. Nature, 2018, 557(7703): 43-49.
[19] 曾昭萍. 第一部分 缅甸输入性Ⅰ型和Ⅱ型登革病毒的全基因组序列测定和分子特征分析; 第二部分 多瘤病毒SV40来源的环状RNA的发现[D]. 北京: 中国医学科学院北京协和医学院, 2019.
[20]郑凯文, 黄晓园 陈渡波, 等. 基于多重PCR和第二代高通量测序技术快速检测下呼吸道感染病原微生物方法的建立和应用[J]. 国际检验医学杂志, 2020, 41(17): 2066-2070.
基金项目:国家重点研发计划(2018YFE020800);海关总署科研项目(2023HK010);广州市科技局项目(2023A04J1279)
第一作者:周健(1995—),男,汉族,湖南衡阳人,硕士,主管技师,主要从事卫生检疫工作,E-mail: zhouj@iqtcnet.cn
通信作者:黄吉城(1965—),男,汉族,广东饶平人,博士,主任技师,主要从事卫生检疫工作,E-mail: huangjc@iqtcnet.cn
1. 广州海关技术中心 广州 510700
1. Guangzhou Customs Technology Center, Guangzhou 510700