CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
一例境外输入无症状感染者新型冠状病毒全基因测序分析
作者:刘甜甜1 王小羽1 江亚娟1 范莹莹1 焦伯延1*
刘甜甜1 王小羽1 江亚娟1 范莹莹1 焦伯延1*
关键词 境外输入;无症状感染者;新型冠状病毒;全基因组测序;新型冠状病毒肺炎
Whole Genome Sequencing of SARS-CoV-2 An
Imported Asymptomatic Case of COVID-19
LIU Tian-Tian1 WANG Xiao-Yu1 JIANG Ya-Juan1 FAN Ying-Ying1 JIAO Bo-Yan1*
Abstract The whole genome sequence of SARS-CoV-2 and its evolutionary characteristics of one imported asymptomatic case of COVID-19 was analyzed. The next generation sequencing technology was used to sequence of the whole genome of SARSCoV-2 of one sputum specimen collected from the case. Bioinformatics software was used in homology analysis, evolutionary tree construction and variation sites analysis. A 29724 bp length sequence of SARS-CoV-2 was obtained, which is of the closest origin to the sequence coded SARS-CoV-2/human/BGD/BCSIR_NILMRC_003/2020 from the importing country in the same month, with the nucleotide homology 99.99%. The sequence was distributed in the B.1.1.25 branch on the evolutionary tree. Compared to wuhan-hu-1, the sequence had 10 nucleotide mutation. 2 nucleotide mutations were located in untranslated regions (UTR), including C29686T mutation in 3'UTR. 8 nucleotide mutations were located in translated regions, resulting in 5 protein mutated including P323L mutation in RdRp and D614G mutation in S protein. Whole genome sequencing was an effective technology for SARS-CoV-2 detection and traceability, which could be used for traceability of overseas imported. The incubation period of a few SARS-CoV-2 infection could be up to 14 days. It was necessary to detect SARS-CoV-2 positive patients as soon as possible.
Keywords overseas imported; asymptomatic patients; severe acute respiratory syndrome coronavirus 2; whole genome sequencing; coronavirus disease 2019
新型冠状病毒(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)是单正链RNA病毒,属于冠状病毒β属,基因组全长约30 kb。基因组含有5'非编码区(5'untranslated regions,5'UTR)、3'UTR和12个开放读码框(open code reading frame,ORF)。开放读码框包括可编码刺突蛋白(spike protein,S)、核衣壳蛋白(nucleocapsid protein,N)、包膜蛋白(envelope protein,E)和膜蛋白(membrane protein,M)4种结构蛋白开放读码器,以及8种非结构蛋白(nonstructural protein,NSP)开放读码器[1-3]。
新型冠状病毒肺炎( coronavirus disease 2019,COVID-19)是由SARS-CoV-2感染引起的一种新发急性传染病,潜伏期一般1~14 d[4]。目前,COVID-19是全球最重大的公共卫生事件之一。截至2022年1月,全球累计确诊超过3.2亿人,死亡超过500万人。全球疫情可能长时间暴发流行,我国面临的境外输入风险或将长期存在[5-6]。
本研究对一例入境15 d无任何临床症状人员开展SARS-CoV-2核酸检测、抗体检测和2代高通量全基因组测序,对基因序列进行进化变异分析和同源性分析,明确为境外输入SARS-CoV-2无症状感染者,为新冠疫情防控提供参考数据。
1 材料和方法
1.1 仪器和试剂
GeneRotex 96全自动核酸提取仪和病毒RNA提取试剂盒均购自西安天隆科技有限公司;新型冠状病毒2019-nCoV核酸检测试剂盒(荧光PCR法)购自上海伯杰医疗科技有限公司;LightCycler 480 II实时荧光定量PCR仪购自Roche公司;MiSeq测序仪及测序试剂Miseq® v2 Reagent Kit和Nextera® XT Library Prep Kit均购自illumina公司;新型冠状病毒全基因组捕获试剂盒和ncov拼接软件均购自北京微未来科技有限公司;新型冠状病毒(2019-nCoV)IgM/IgG抗体检测试剂盒(胶体金法)购自英诺特(唐山)生物科技有限公司。
1.2 流行病学调查
某男性病例于2020年5月7日从孟加拉国回国,5月20日核酸检测阴性,5月21日集中隔离满2周,5月22日返至济宁,经某县疾病预防控制中心检测痰标本核酸SARS-CoV-2 N基因和ORF1ab基因均为阳性,经济宁市疾病预防控制中心复核,明确为境外输入SARS-CoV-2 感染者。
1.3 实验方法
1.3.1 实时荧光定量PCR检测和抗体检测
5月22日和5月23日分别采集痰标本和血清标本,取 200 μL痰样本进行核酸提取和实时荧光定量PCR检测,具体操作步骤详见商品化试剂盒说明书。取10 μL血清样本进行SARS-CoV-2 IgM和IgG抗体检测,具体操作详见试剂盒说明书。
1.3.2 SARS-CoV-2全基因组测序
取5月22日痰标本提取的核酸20 μL进行逆转录和SARS-CoV-2全基因组捕获,具体操作详见北京微未来科技有限公司说明书。按照illumina公司测序流程说明书进行测序。利用ncov拼接软件进行SARS-CoV-2序列拼接。
1.3.3 序列分析
核苷酸、氨基酸同源性分析和进化树构建方法详见我们之前的研究[7]。利用Pangolin分型法对SARS-CoV-2序列进行分型;利用RNAfold软件构建5'UTR和3'UTR二级结构;利用SOPMA 软件构建蛋白二级结构;利用NetPhos 3.1、iUbiq-Lys、GPS-SUMO和GPS-PAIL软件分别分析蛋白磷酸化、泛素化、SUMO化和乙酰化位点。
2 结果
2.1 流行病学调查及实验室检测
入境第15天,SARS-CoV-2核酸检测N基因和ORF1ab基因均阳性,SARS-CoV-2抗体检测IgM和IgG均阴性;入境第16天,核酸检测N基因和ORF1ab基因均阳性,抗体检测IgM阳性,IgG阴性。具体检测结果详见表1。济宁市级专家组结合流行病学调查结果、实验室检测结果和临床特征诊断该病例为境外输入SARS-CoV-2无症状感染者。
2.2 全基因测序
2020年5月22日痰标本核酸进行高通量全基因组测序,获得1条29724 bp的SARS-CoV-2全基因组序列,命名为JW-001,序列含有88723个腺嘌呤(adenine,A)、9548个胸腺嘧啶(thymine,T)、5842个鸟嘌呤(guanine,G)、5461个胞嘧啶(cytosine,C)。
表1 核酸检测和抗体检测结果
Table 1 Detection results of SARS-CoV-2 nucleic acid and antibody
采样日期 | 核酸检测结果 | 抗体检测结果 | ||
N基因 (Ct值) | ORF1ab基因 (Ct值) | IgM | IgG | |
2020年5月22日 | 阳性 (30.97) | 阳性 (31.62) | 阴性 | 阴性 |
2020年5月23日 | 阳性 (26.70) | 阳性 (26.86) | 阳性 | 阴性 |
2.3 进化分析
分析JW-001序列,并与邻近地区和孟加拉国早期SARS-CoV-2全基因组序列进行比较,利用MEGA 7.0.14软件构建SARS-CoV-2全基因组序列进化树。在进化树上,JW-001与孟加拉国序列SARS-CoV-2/human/BGD/BCSIR_NILMRC_003/2020(GenBank:MT578016.1,以下简称BGD-003)、BGD-002(GenBank:MT578017.1)同属B主分支B.1.1.25分支。如图1所示。
2.4 基因同源分析
利用美国国家生物技术信息中心(NCBI)的基本局部比对搜索工具进行JW-001同源序列比对分析,发现JW-001与来自孟加拉国2020年5月份序列BGD-003同源性最高。
以wuhan-hu-1(GenBank:MN908947.3)、BGD-003和BGD-002全基因组序列作为参考,JW-001与wuhan-hu-1、BGD-003和BGD-002序列进行同源性分析,核苷酸同源性分别为99.97%、99.99%和99.98%。其中与wuhan-hu-1编码区相比,N基因同源性最低,核苷酸和氨基酸同源性分别为99.76%和99.52%。各基因同源性分析结果见表2。
2.5 非编码区变异分析
与wuhan-hu-1相比,JW-001在5'UTR发生了C241T变异,241位核苷酸位于5'UTR茎环结构SL5B的环结构[8]。利用RNAfold软件分析5'UTR二级结构,JW-001和wuhan-hu-1的5'UTR二级结构高度一致,二级结构最小自由能均为-82.10 kcal/ mol,如图2-A和2- B所示。
A: wuhan-hu-1 5'UTR二级结构; B: JW-001 5'UTR二级结构; C: wuhan-hu-1 3'UTR二级结构; D: JW-001 3'UTR二级结构
图2 5'UTR和3'UTR二级结构
Fig.2 The secondary structure of 5'UTR and 3'UTR
3'UTR发生了C29686T变异。此外,与JW-001同一进化簇的BGD-002(图1)也发生了C29686T变异。经BLAST分析,截至2021年12月2日,在NCBI数据库共有3487条序列发生C29686T变异,占比为0.14%,说明C29686T变异普遍存在。29686位核苷酸位于3'UTR的高变区(hypervariable region,HVR)[8],利用RNAfold软件分析3'UTR二级结构,HVR的29683-29689位核苷酸与29815-29821位核苷酸互补形成茎结构,茎结构7对核苷酸中,wuhan-hu-1有6对互补,而发生C29686T变异的JW-001的7对核苷酸均互补,说明JW-001的3'UTR HVR结构更稳定;wuhan-hu-1的3'UTR最小自由能为-74.80 kcal/mol,JW-001的3'UTR最小自由能为-78.90 kcal/mol,如图2-C和2-D所示。
2.6 编码区变异分析
与wuhan-hu-1相比,JW-001的NSP2、RdRp、helicase、S蛋白和N蛋白的氨基酸位点发生了变异,见表3。
表3 JW-001氨基酸变异分析
Table 3 Amino acid variations analysis of JW-001
蛋白名称 | 编码区核苷酸变异 | 氨基酸变异 |
NSP2 | A1163T | I120F |
PLpro | C3037T | F108F |
RdRp | C14408T | P323L |
helicase | A16417G | T61L |
S蛋白 | A23403G | D614G |
N蛋白 | GGG28881-28883AAC | R203K、G204R |
NSP2发生I120F变异。异亮氨酸(Isoleucine,I)和苯丙氨酸(Phenylalanine,F)均是疏水性氨基酸,疏水性氨基酸常位于蛋白质的内部。利用SOPMA 软件分析NSP2二级结构,发现I120F变异未改变NSP2二级结构性质,说明I120F变异对NSP2结构影响可能较小,见图3。
RdRp发生P323L变异。323位氨基酸位于RdRp的连接结构域(Interface)[9],P323L是SARS-CoV-2最重要的变异之一,P323L变异能够改变RdRp的结构,影响SARS-CoV-2的复制[10-11]。目前,P323L突变株是最重要的流行株, B.1.1.7变异株(又称阿尔法变异株)、B.1.617.2变异株(又称德尔塔变异株)和B.1.1.529变异株(又称奥密克戎变异株)均发生P323L突变。
Helicase发生T61L变异。苏氨酸(threonine,T)是蛋白最重要的磷酸化位点,T磷酸化后能够影响蛋白功能[12]。经NetPhos 3.1分析,T61不能被磷酸化,因此,T61L变异不改变Helicase的磷酸化水平。
S蛋白发生D614G变异。D614G是SARS-CoV-2最主要的变异形式之一,D614G变异能够改变S蛋白的结构和性质,使SARS-CoV-2感染能力变强,促进SARS-CoV-2的快速传播[13]。D614G突变是新冠病毒最重要的突变之一,其中阿尔法变异株、德尔塔变异株和奥密克戎变异株均发生D614G突变。
N蛋白发生R203K和G204R变异。赖氨酸(Lysine,K)带正电荷,N蛋白R203K和G204R变异,K的正电荷量与邻近磷酸化基团静电作用,可以稳定N蛋白结构[14]。此外,K是蛋白质翻译后最重要的修饰位点,经iUbiq-Lys、GPS-SUMO和GPS-PAIL分析,变异后的K不能被泛素化、SUMO化和乙酰化。说明R203K变异对N蛋白翻译后修饰水平影响可能较小。阿尔法变异株和奥密克戎变异株均发生R203K和G204R变异。
h:α-螺旋; c: 无规卷曲; e: 延伸链
图3 NSP2二级结构
Fig.3 The secondary structure of NSP2
3 讨论
COVID-19主要通过呼吸道传染,传染性强,人群普遍易感。虽然COVID-19在我国得到有效控制,但是国外疫情形势依然严峻,我国面临境外输入风险依然存在,因此做好COVID-19境外输入防控是一项长期任务,特别是针对潜伏期较长的无症状感染者,因其隐秘性强,较易引起疏忽,应引起高度重视。
实时荧光定量PCR检测、抗体检测和全基因组测序是实验室诊断SARS-CoV-2感染的核心技术[4,15],特别是全基因组测序能够获得病毒全基因序列信息,是SARS-CoV-2分型、进化变异分析、病毒溯源的关键,目前,全基因组测序广泛应用于SARS-CoV-2的检测和溯源[6,16]。
本研究病例经孟加拉国入境,入境第15天SARS-CoV-2核酸检测N基因和ORF1ab基因均阳性,入境第16天,SARS-CoV-2抗体检测IgM阳性。为追溯病毒来源,本研究进行了SARS-CoV-2全基因组测序,获得1条29724 bp序列。经BLAST分析,与孟加拉国同月份序列BGD-003同源性最高,排除国内感染可能,明确为境外输入SARS-CoV-2无症状感染者。
JW-001属于B.1.1.25分支,与BGD-003相比仅存在2个核苷酸差异,同源性为99.99%;与wuhan-hu-1相比,JW-001存在10个核苷酸变异,变异覆盖非编码区和编码区。其中,5'UTR、ORF1ab基因、S基因、N基因和3'UTR发生了核苷酸变异,而NSP2、RdRp、helicase、S蛋白和N蛋白发生了氨基酸变异。
5'UTR和3'UTR是SARS-CoV-2的非编码区,可以形成复杂的二级结构参与SARS-CoV-2复制、翻译和组装等过程。5'UTR可以结合N蛋白参与病毒组装,结合翻译起始因子和核糖体参与ORF1ab基因的翻译,并可结合3'UTR参与病毒复制[17-18]。3'UTR为RdRp提供结合位点,起始SARS-CoV-2复制[18]。本研究JW-001的5'UTR和3'UTR均发生1个核苷酸位点变异。其中,5'UTR发生的C241T变异位于茎环SL5B的环结构,变异未能引起茎环SL5B结构的改变。但3'UTR发生的C29686T变异,致使HVR茎结构29686位的核苷酸T能够与29818位的核苷酸A互补,HVR的茎结构更加稳固。此外,大量SARS-CoV-2序列发生C29686T变异,说明C29686T变异可能在SARS-CoV-2进化变异和病毒复制过程中发挥一定作用,但仍需进一步研究确定。
S蛋白和N蛋白是SARS-CoV-2的结构蛋白,S蛋白形成SARS-CoV-2的刺突,能够结合宿主受体从而使病毒进入宿主细胞。N蛋白是SARS-CoV-2的核衣壳蛋白,参与病毒组装。RdRp是SARS-CoV-2的RNA依赖的RNA聚合酶,是SARS-CoV-2基因组的复制酶[1-3]。Helicase是SARS-CoV-2的解旋酶,可与RdRp结合参与病毒复制,并可参与病毒mRNA加帽[19]。NSP2是SARS-CoV-2的非结构蛋白。NSP2能够改变宿主微环境和信号传导[20]。JW-001这些蛋白发生了变异,可能影响病毒蛋白的部分功能,特别是S蛋白D614G变异和RdRp的P323L变异能够改变SARS-CoV-2复制能力和感染能力。
4 结论
综上,本研究对一例入境15 d病例进行SARS-CoV-2核酸检测和抗体检测,确定为SARS-CoV-2症状感染者,通过SARS-CoV-2全基因组测序明确为境外输入,说明其潜伏期可能超过14 d。本研究为我国科学防控COVID-19境外输入提供依据,特别是为防控长潜伏期SARS-CoV-2无症状感染者提供参考数据。
参考文献
[1]陈凯, 蒋素文, 胡爱荣, 等. 新型冠状病毒肺炎的病原学研究进展[J]. 中华微生物学和免疫学杂志, 2020(4): 256-261.
[2]刘彬, 秦照玲, 戚中田, 等. 新型冠状病毒基因组结构与蛋白功能[J]. 微生物与感染, 2020, 15(1): 52-57.
[3]龚国利, 王亮, 吴纣, 等. 新型冠状病毒SARS-CoV-2的研究进展[J]. 重庆理工大学学报(自然科学), 2020, 34(4): 42-50.
[4]中华人民共和国国家卫生健康委员会. 关于印发新型冠状病毒肺炎诊疗方案(试行第八版 修订版)的通知(国卫办医函[2021]191号)[EB/OL]. 2021-4-25.http://www.gov.cn/zhengce/zhengceku/2021-04/15/content_5599795.htm.
[5]郭西亚,郭雯雯,李鹏,等. 中国内地境外输入新型冠状病毒肺炎确诊病例流行病学特征分析[J]. 中国公共卫生, 2020, 36(12): 1763-1766.
[6]郑宝璐, 高鑫, 庄志超, 等. 天津滨海新区本土疫情新型冠状病毒全基因组测序和溯源分析[J]. 中华微生物学和免疫学杂志, 2021, 41(8): 581-587.
[7]王体辉, 段延华, 韩淑琪, 等. 2017—2020年度济宁市乙型流感病毒监测及 HA和 NA基因变异和进化分析[J]. 中华微生物学和免疫学杂志, 2021, 41(4): 301-305.
[8] Rangan R, Zheludev I N, Hagey R J, et al. RNA genome conservation and secondary structure in SARS-CoV-2 and SARS-related viruses: a first look[J]. RNA, 2020, 26(8): 937-959.
[9] Gao Y, Yan L, Huang Y, et al. Structure of the RNA-dependent RNA polymerase from COVID-19 virus[J]. Science, 2020, 368(6492): 779-782.
[10] Chand G B, Banerjee A, Azad G K, et al. Identification of novel mutations in RNA-dependent RNA polymerases of SARS-CoV-2 and their implications on its protein structure[J]. PeerJ, 2020, 8: e9492.
[11] Mohammad A, Al-Mulla F, Wei D Q, et al. Remdesivir MD Simulations Suggest a More Favourable Binding to SARS-CoV-2 RNA Dependent RNA Polymerase Mutant P323L Than Wild-Type[J]. Biomolecules, 2021, 11(7):1-15.
[12] Pagano G J, Arsenault R J. Advances, challenges and tools in characterizing bacterial serine, threonine and tyrosine kinases and phosphorylation target sites[J]. Expert Rev Proteomics, 2019, 16(5): 431-441.
[13] Groves D C, Rowland-Jones S L, Angyal A, et al. The D614G mutations in the SARS-CoV-2 spike protein: Implications for viral infectivity, disease severity and vaccine design[J]. Biochem Biophys Res Commun, 2021, 538: 104-107.
[14]Maitra A, Sarkar M C, Raheja H, et al. Mutations in SARS-CoV-2 viral RNA identified in Eastern India: Possible implications for the ongoing outbreak in India and impact on viral structure and host susceptibility[J]. J Biosci, 2020, 45(1): 1-18.
[15]王体辉, 江亚娟, 范莹莹, 等. 应用数字PCR对新型冠状病毒核酸检测结果的分析[J].中国口岸科学技术, 2021, 3(8): 65-69.
[16]夏险, 李京京, 董昌金, 等. 基因组测序在新型冠状病毒研究中的应用[J]. 湖北师范大学学报(自然科学版), 2020, 40(3): 56-61.
[17] Miao Z, Tidu A, Eriani G, et al. Secondary structure of the SARS-CoV-2 5'-UTR[J]. RNA Biol, 2021, 18(4): 447-456.
[18] Sola I, Mateos-Gomez P A, Almazan F, et al. RNA-RNA and RNA-protein interactions in coronavirus replication and transcription[J]. RNA Biol, 2011, 8(2): 237-248.
[19] Jang K J, Jeong S, Kang D Y, et al. A high ATP concentration enhances the cooperative translocation of the SARS coronavirus helicase nsP13 in the unwinding of duplex RNA[J]. Sci Rep, 2020, 10(1): 1-13.
[20] Cornillez-Ty C T, Liao L, Yates J R, 3rd, et al. Severe acute respiratory syndrome coronavirus nonstructural protein 2 interacts with a host protein complex involved in mitochondrial biogenesis and intracellular signaling[J]. J Virol, 2009, 83(19): 10314-10318.
基金项目:山东省医药卫生科技发展计划项目(202112060725),济宁市重点计划研发项目[医学研究和临床医学类(2021018)]
第一作者:刘甜甜(1986—),女,汉族,山东济宁人,本科,主管技师,主要从事疾病预防控制,E-mail: liutian_98@163.com
通讯作者:焦伯延(1983—),男,汉族,山东济宁人,博士,副主任技师,主要从事微生物检验,E-mail: j198319831983@126.com
1.济宁市疾病预防控制中心 济宁 272000
1.Jining Center for Disease Control and Prevention, Jining 272000