同化作为进化的核心驱动力,赋予生物体消除有害突变、融合有益突变的能力。这一机制对HIV的生存尤为关键。宿主内的重组不仅推动了病毒的多样性,还助力其免疫逃逸,以及对抗多药耐药性。即便在病毒突变率极高的背景下,重组仍确保了基因组的稳定性。
按先前估计,HIV的平均重组率约为每代每碱基10^-5或更高,但最新研究揭示,这一平均值未能全面反映不同环境下的重组率变化。
鉴于重组在HIV进化成功中的决定性作用,深入探究其变异的根本因素显得尤为重要。
HIV的重组率受两个主要过程控制:细胞共感染和逆转录酶模板转换。
细胞共感染导致同一细胞产生的病毒粒子包含不同病毒基因组,这些粒子感染新细胞时,模板切换可能引发重组,产生继承自两个双亲链的基因组。共感染率增加会提高不同基因组病毒粒子的数量;模板转换率增加则会增加每个基因组的重组事件,从而创造新的病毒基因型。
图1.HIV重组率的驱动因素
A)导致不同病毒基因组之间重组的HIV复制周期的卡通示意图。确定重组率的步骤以粗体显示。
B)病毒载量较高的HIV群体(下框)与病毒载量较低的HIV群体(上框)相比,病毒共感染率较高,因此重组率较高。
C)连锁衰变模式能够估计重组率。
D′值量化给定时间点SNP对之间的遗传连锁。两个采样时间点上D′值(此处称为连锁衰变测量或LDM)的负对数值比与采样点之间的时间和SNP之间的距离的积正相关。这种关系的斜坡可用于估计复合率ρ。研究将这个方法称为RATS-LD。
模板转换率的变化在病毒重组中起关键作用,特别是在体外和体内环境中。序列相似性的降低会抑制模板转换和重组,尤其是在相似性低于63%时,几乎完全阻止这些过程,导致基因组完整性崩溃。最近的研究还确定了HIV-1基因组中模板转换和重组的热点和冷点,这些位置影响病毒种群的多样化。然而,关于共感染率如何影响体内病毒重组的机制仍不明确。虽然小鼠模型和细胞培养研究表明,共感染增加与重组病毒增加相关,但这种效应在人类HIV感染中的普遍性尚不清楚。病毒载量和CD4+ T细胞的丰度和位置可能介导共感染的发生,暗示病毒载量与共感染率之间可能存在非线性关系。此外,病毒宿主内的人口统计学可能在调节共感染率和病毒重组率中发挥重要作用(图1B)。
现有的HIV重组率估计方法主要依赖于识别测序数据中的断点或利用连锁不平衡模式,但这些方法受限于单基因组放大和测序数据的分析,导致采样深度不足,难以在不同病毒载量组间进行准确比较。批量测序虽能提供更深层次的采样,但其短读段限制了连锁测量,且HIV的高重组率进一步破坏了遗传连锁。因此,无断点方法在处理批量测序数据时可能更敏感。
近期,MOLECULAR BIOLOGY AND EVOLUTION发布了一项研究,来自华盛顿大学的研究团队开发了一种新方法——时间序列连锁衰变重组分析(RATS-LD),通过纵向批量测序数据量化重组率,并验证了其在模拟数据中的有效性。应用该方法于不同病毒载量的HIV数据,发现病毒载量与重组率呈正相关:低病毒载量组的重组率与先前估计一致,而高病毒载量组的重组率中位数高出近6倍。此外,个体内的病毒载量和有效重组率也显示出同步增加的趋势。这些结果表明,重组率是动态变化的,受宿主内条件调节,且这种调节机制可能普遍存在于其他病毒中。
doi:10.1101/2023.05.05.539643
利用跨时间点突变间的连锁自相关来量化重组。在短读段测序条件下,首先通过模拟数据验证了RATS-LD的有效性,随后将其应用于纵向、高通量的宿主体内病毒测序数据,并根据病毒载量(作为群体密度的代表)对数据进行分层处理。
研究结果
通过时间序列连锁衰变(RATS-LD)进行重组分析,在病毒载量最低(<26,800拷贝/毫升)的病毒群体中,研究估算的重组率为1.5×10^-5事件/碱基组/代(95%置信区间:7×10^-6至2.9×10^-5),与现有估计值相近。然而,在病毒载量最高(>82,000拷贝/毫升)的样本中,研究的中位数估计值显著高出约6倍。此外,研究发现,重组率与病毒载量在不同时间点上不仅在个体间存在协变关系,在单个个体内部亦呈现相关性。
1.使用短读取数据测量主机内呼吸率
研究开发了一种基于短读段测序数据量化宿主内病毒群体重组率的方法,称为RATS-LD。该方法利用D’值(衡量SNP对之间连锁平衡的指标)随时间的衰减来估计重组率。通过计算多个时间点上SNP对的连锁衰变测量(LDM),并分析LDM与时间和距离的关系,可以推导出重组率ρˆ。这种方法适用于短读段测序数据,是对现有重组率估计方法的扩展。
2.中立性下载模拟数据上验证RATS-LD
RATS-LD方法通过捕捉不同距离处连锁衰变的差异速率来估计重组率。研究评估了该方法在特定条件下(150至300代、1至400碱基对距离、病毒进化动力学)的准确性,使用模拟的重组率(集中在HIV宿主内估计的范围内)进行测试。结果显示,RATS-LD在检测连锁衰变与物理距离的关系上有效,尤其是在HIV重组率范围内(10^-5至10^-4),能够准确区分重组率的差异。尽管在极端重组率下存在分辨率问题,但RATS-LD在大多数情况下能正确排序和区分重组率,且I型错误率低(图2)。
图2.RATS-LD重新捕获模拟数据中的真实重组率,并准确区分不同的重组率
A)根据模拟数据计算的连锁衰变曲线表现出相对于dΔt的饱和模式,该模式取决于基础重组率ρ(显示移动平均值,窗口大小= 500碱基×世代)。
B)这些曲线在dΔt = 0时的斜坡用作 RATS-LD’s的估计值,并重新捕获模拟数据中的已知ρ值。每个点代表1,000个估计值的引导分布的中位数。
C)研究进行了区分分析,以确认RATS-LD可以区分不同的重组率。研究用设定的重组率模拟了数据,并使用RATS-LD估计了ρ。
D)然后,研究将模拟与相差1、1.1、1.2、1.5、2或5倍的重组率随机配对,以评估RATS-LD通过简单排名D)和非重叠自举95%置信区间E)正确区分潜在重组率的频率。
3.在更好地再现宿主内艾滋病毒的环境下验证RATS-LD
在宿主内HIV受到选择压力的情况下,RATS-LD仍能有效区分重组率。通过模拟正选择和负选择(适应度效应范围为-0.1至0.05),发现选择压力下的连接衰减曲线比中性模拟更嘈杂,但RATS-LD仍能准确捕捉潜在的重组率(图3)。
图3. RATS-LD 可以估计模拟 HIV 宿主内进化条件下的重组率
A) 在类似 HIV 的选择性条件下进行模拟得出的重组率估计值再现了已知的 ρ 值。
B) 通过双向迁移相互连接的模拟细分种群的重组率估计值。每一代中,每个亚群都有一定比例的 m 从另一个亚群移出(m=10^-2、10^-3、10^-4、10^-5)。
C) 在一系列有效种群规模(Ne=5×10^3 到 5×10^5)下模拟的数据集的重组率估计值。研究绘制了 Ne 值小于 10^5 时的 10 个估计组和 Ne 值≥ 10^5 时的 5 个估计组。在所有三个板块中,每个点代表 1,000 次引导的估计中值。
研究探讨了宿主体内HIV演化的复杂性,特别是不同病毒亚群之间的种群结构对估计结果的影响。通过模拟两个通过迁移率m连接的HIV亚种群,研究发现极低迁移率(m = 10^-5)会略微降低估计值,但迁移率大于10^-4对估计值影响很小。进一步分析显示,即使在高迁移率下,RATS-LD的性能未受显著影响。此外,研究还探讨了有效种群规模(Ne)的变化对连接模式的影响,结果表明在不同Ne值下,RATS-LD的准确性保持稳定。
研究发现,虽然有效种群规模(Ne)的增加会略微加快连接分解速度,但对重组率(ρ)估计的影响较小,在现有HIV估计值的重组率范围内尤其明显。例如,Ne值相差100倍时,重组率仅相差约2.5倍。然而,在Ne和ρ值极高的情况下,连接衰减过快,导致取样方案无法准确测量基线数据。这些高Ne值的模拟与体内数据不匹配,表明有效种群规模的变化不是导致重组率估计差异的唯一原因。
4.将RATS-LD应用于体内HIV数据
研究使用RATS-LD方法分析了10名未接受抗逆转录病毒治疗的HIV感染者的病毒序列,以量化不同病毒载量下的重组率变化。数据集来自Zanini等人(2015),采样时间跨度为6至12年,且采样深度高,中位数为800。研究结果显示,平均重组率为3.6×10^-5事件/碱基/代,略高于先前估计。研究还发现,个体内部和个体之间的病毒载量差异显著,且重组率与病毒载量相关。通过将数据按病毒载量三分位数分组,研究进一步分析了重组率与病毒载量的关系。图4A中,研究用对应于病毒载量三分位数的阴影显示了每个参与者的病毒载量时间过程。
图4. 重组率升高与体内高病毒载量有关
A) 每个参与者的病毒载量时间进程图。背景阴影和水平分界线表示病毒载量三等分:<虽然这里显示的是单个时间点的病毒载量,但使用成对的时间点来组成用于估算的组,并根据其平均病毒载量进行排序(见在线补充材料中的补充图 S9 和 S10)。
B) RATS-LD 用于估算的曲线拟合。代表每组 bootstrap 分布(1,000 次 bootstraps)中位数估计值的曲线拟合叠加在活体数据 LDM 的分档平均值上(移动平均值仅用于显示目的,窗口大小 = 500 bp × 代)。
C) 分别显示三个四分位数的重组率估计值 ρˆ(1,000 次引导)。每个方框代表 ρˆ 分布的四分位数,中间线表示中位数。
研究使用 RATS-LD 方法分析了不同病毒载量组的重组率(ρˆ)。结果显示,病毒载量低于 26,800 拷贝/毫升的组中,ρˆ 为 1.5×10^-5 重组事件/bp/代,与现有 HIV 重组率估计值相近。而在病毒载量高于 82,000 拷贝/毫升的组中,ρˆ 中值高出近 6 倍,为 8.9×10^-5 重组事件/bp/代。中间病毒载量组的ρˆ 介于两者之间,但更接近低病毒载量组。研究通过剔除分析和不同数据集的验证,确认了这些结果的稳健性。
为进一步探讨病毒载量与重组率之间的定量关系,研究进行了一项分析,根据病毒载量达到特定阈值的平均值对LDM进行分组。通过这种方式,研究能够更深入地评估病毒载量是否对重组率产生剂量依赖性影响。分析结果显示,病毒载量阈值越高,估计的重组率越趋向于极端值。
举例说明,就是当平均病毒载量超过20万拷贝/毫升时,估计的重组率ρˆ显著高于流行病学估计值(1.1×10^-4,CI 7.5×10^-5到 1.6×10^-4),接近一个数量级的差异。
虽因样本量较小导致曲线拟合存在较大变异,但在更极端的阈值下,引导置信区间也相应扩大。综上所述,这些研究结果提示,在高病毒载量条件下,HIV群体的重组频率可能远超先前的估计。
研究分析了病毒载量与个体内部重组率的关系,发现病毒载量越高,重组速度越快。研究中,只有参与者1的数据足够多,能检测到重组率的显著差异(图5)。结果显示,病毒载量高于中位数时,重组率显著高于低于中位数时。虽然其他参与者(3、4、7)的病毒载量范围较窄,且RATS-LD检测能力有限,但他们的数据也显示了类似趋势。个体内部的分析总体上表明,随着人群病毒载量的变化,重组率等重要的进化参数也会随之变化。
图5. 参与者 1 的高病毒载量也与重组率升高有关
A) 参与者 1 的病毒载量随估计感染日期(EDI)后天数的变化轨迹。背景阴影表示根据平均病毒载量将时间点对分为两组(水平中线以上为橙色,水平中线以下为蓝色)。每组包含约 6,000 个 LDM。
B) 参与者 1 体内数据(移动平均值仅用于显示目的,窗口大小 = 1,000 bp × 代)中 LDM 的分档平均值上叠加了代表各组相应 bootstrap 分布(1,000 个 bootstraps)中位数估计值的曲线拟合。
C) 仅使用参与者 1 的数据对平均病毒载量测量值高于或低于中位数的时间进行重组率估计。每个方框表示特定病毒载量组的 ρˆ bootstrapped 分布的四分位数范围(1,000 Bootstraps)。
HIV的高重组率极大地促进了其在宿主体内的多样性,从而为免疫逃逸和多药耐药性的形成提供了可能。尽管研究已知HIV的重组率在基因组的不同位置存在差异,但对于重组在整个感染过程中或个体间的变化情况,研究仍知之甚少,这主要受限于细胞共感染率的影响。研究推测,宿主体内群体密度越高,可能伴随更高的共感染率,进而导致更高的重组率。为验证这一假设,团队创新性地开发了一种新方法。上述研究结果表明,重组并非作为一种恒定、均匀的力量,而是随着时间的推移,在宿主体内病毒群体及其内部能够动态且剧烈地变化。更广泛地,研究推测这种现象可能对其他空间共定位不同的兼性无性群体产生影响。
讨 论
HIV在宿主体内的进化过程极为复杂,伴随着病毒载量的波动,选择压力与突变机会的变迁共同推动了这一进程。本文揭示,HIV在宿主体内的重组率亦非恒定,而是随着感染进程动态变化,与病毒载量及有效种群密度的波动相呼应。华盛顿大学团队创新性地提出了RATS-LD方法,该方法揭示了在病毒载量高峰期的病毒群体中,重组率显著提升。
该研究不仅量化了不同病毒群体间的重组差异,还发现单个病毒群体内部的重组率随病毒载量的变化呈现出近数量级的波动。尽管HIV重组现象早已被视为常态,这些发现表明,在某些宿主体内,重组率可能远超先前人们的认知。
通过对不同有效群体大小(Ne)的模拟分析,研究发现,高病毒载量群体中的重组率提升并非单纯由Ne与病毒载量的正相关关系所致。在合理的Ne值范围内进行调整后,研究观察到估计重组率的差异远小于体内高病毒载量组与低病毒载量组之间的差异(如图3B所示)。然而,高病毒载量人群中Ne的增加确实可能是重组率估计值上升的一个促进因素。
研究显示,病毒载量最高的人群中重组率的增幅最为显著,这与先前一项研究结果相吻合,该研究指出,病毒载量低于10^5拷贝/毫升的群体中,体内CD4+ T细胞共感染率仅有适度差异,而病毒载量高于10^6拷贝/毫升的群体中,共感染率显著升高。研究的研究不仅验证了这些结果在独立队列中的普遍性,更进一步将可变的共感染率与体内定量不同的病毒重组率紧密联系起来。尽管此前在细胞培养中通过实验操纵病毒密度已证实了这一效应,但本研究首次提供了宿主体内病毒密度变化足以导致人类宿主体内重组率发生显著变化的直接证据。
这种先前未被察觉的重组率变化,可能深刻影响宿主体内的进化动力学及对病毒数据的解读。尽管研究分析的多数测序数据并非源自急性感染期,但HIV初期扩张阶段病毒载量的极端峰值不容忽视。若高病毒载量普遍伴随重组率提升,那么重组机制可能推动新型病毒单倍型的生成达到前所未有的程度——尤其在拥有多传染来源的人群中药更加小心。
感染早期阶段相对较低的群体多样性可能部分抵消这一效应,其间的相互作用值得未来深入探究。
近期研究亦指出,重组率升高可能掩盖宿主体内HIV群体的空间分布特征。相反,接受不完全抑制性抗逆转录病毒治疗(ART)的个体,其低病毒载量可能导致较低的重组率,从而减少不同遗传背景下耐药突变的重组,降低多药耐药性的风险。低病毒载量人群中较低的重组率,也可能使依赖于树状进化分支的系统发生学方法更易应用,无需借助祖先重组图。
团队虽未能获取接近检测极限的极低病毒载量样本,但未来研究可探讨先前报告的平均重组率(≈1.4×10^-5)是否足以解释低病毒载量模式下的连锁衰变现象。
病毒载量虽是衡量种群密度的便捷指标,却难以全面捕捉HIV集合群的复杂动态,这些集合群可能跨越不同解剖位置,并在个体间展现不同功能。鉴于HIV感染者体内多数T细胞未被感染,感染细胞的局部种群密度对于确定重组率ρ可能至关重要。未来对此假设的验证,宜通过局部测量淋巴组织中不同病毒密度下的共感染与基因交换来实现。此类样本的采集具有侵入性,尤其是纵向收集,因此,人口水平总体测量的方法仍具有原则性的宝贵价值。即便在高水平测量如病毒载量中,亦可观察到与重组率的正相关,这进一步凸显了密度作为体内重组媒介的重要性。
与其它体内方法类似,RATS-LD依赖自然分离位点作为遗传标记,以追踪连锁的破坏。这种分解速度不受种群多样性影响,但准确量化其平均值的能力确实依赖于可识别的分离位点数量。因此,突变数量的多寡仅影响RATS-LD的置信度,而非估计重组率本身的偏差。多样性较低的群体需更多样本池化以获取足够的数据点对,这限制了研究有效估计较小、多样性较差群体中重组率的能力。
本文讨论了重组事件在病毒进化中的重要性及其检测的局限性。主要观点包括:
①重组事件的检测局限:由于无法检测到相同序列之间的重组,如果病毒爆发局限于特定空间位置,共同感染和重组的比率可能很高,但这种方法无法检测到。细胞间的传播也可能影响重组事件的发生。
②RATS-LD技术的应用与限制:RATS-LD是一种用于量化快速重组的有效技术,但其效果受测序策略(如读段长度和采样时间间隔)的限制。低重组率可能难以检测,而高重组率可能导致连锁反应迅速衰变,需要更密集的采样。
③RATS-LD的适用性与评估建议:
抽样特征:在至少500个分离位点和超过40的采样深度下表现最佳。
ρˆ性能范围:在150至300代时间间隔内,可区分5×10^-6至5×10^-4范围内的重组率。
连锁衰变曲线:通过移动窗口分组可视化,评估重组率估计的准确性。
引导检查:双峰自举或跨越多个数量级的自举反映曲线匹配不良,应谨慎对待。
④重组率与种群密度的关系:更高的重组率与更高的种群密度之间的联系可能在兼性无性群体中更为广泛,影响病毒物种多样性及更广泛的理解。
参考文献:Romero EV, Feder AF. Elevated HIV viral load is associated with higher recombination rate in vivo. Preprint. bioRxiv. 2023;2023.05.05.539643. Published 2023 Oct 10. doi:10.1101/2023.05.05.539643