mRNA疫苗和疗法已成为应对传染性疾病、肿瘤的有效工具。如何设计高效稳定的mRNA是关键问题,需要同时考虑到非翻译区(UTR)和编码区(CDS)。之前的研究方法往往只考虑到UTR或CDS一方面,而没有同时关注翻译起始和延伸效率。近日,百度PaddleHelix在之前LinearDesign的基础上提出了LinearDesign2的新设计算法。
该算法基于人工神经网络,首先利用之前开发的LinearDesign方法对CDS进行优化,提高密码子适应指数,降低最低自由能。进一步固定CDS优化5'-UTR区域,通过引入随机突变,利用进化算法筛选出预测延伸效率最高的UTR序列。在获得UTR序列,迭代优化CDS序列,通过引入同义突变结合进化算法,综合考虑序列的密码子适应度,自由能和翻译起始效率。最终获得符合预期的mRNA序列。
研究者利用该算法对SARS-CoV-2刺突蛋白,VZV糖蛋白抗原进行了mRNA疫苗设计,预测翻译效率都得到了明显提升。研究者进一步在GFP的案例上证实了预测翻译效率与真实实验测得效率的一致性,LinearDesign2提供的mRNA版本远优于现有其他方法。
总的来说,LinearDesign2为mRNA疫苗理性设计提供了一个强有力的工具。