模型应用|语言模型竟能追踪病毒( 二 )
此外 , 该模型可以在相对少量的信息上进行训练——在这项研究中 , 研究人员使用了60000条HIV序列、45000条流感序列和4000条冠状病毒序列 。
“语言模型非常强大 , 因为它们可以学习这个复杂的分布结构 , 并从序列变化中获得一些对功能的洞见 。”Hie告诉采访人员 , “我们在每个氨基酸位置都有大量的病毒序列数据 , 模型通过训练数据学习氨基酸特性 。”
该模型一旦经过训练 , 研究人员便能使用它来预测冠状病毒刺突蛋白、HIV包膜蛋白和流感血凝素(HA)蛋白的序列变化 , 这些蛋白或多或少可能产生逃逸突变 。
“发现看似不相关的科学分支之间的联系 , 可能会发展出加速一个分支研究的新方法 。该研究提供了一个此类联系的示例 。作者发现了病毒与自然语言之间的相似之处 , 进而提出了一种识别突变的强大新方法 , 这种突变可以使病毒通过中和抗体逃脱识别 。”未参与该研究的美国国家医学图书馆的Teresa M. Przytycka等人在相关评论文章中指出 。
知己知彼 阻断逃逸
对于流感 , 该模型揭示了最不可能发生突变和产生病毒逃逸的序列是在HA蛋白的茎部 。这与最近研究一致 , 表明针对HA茎部的抗体几乎可以提供全面的保护 , 以对抗任何流感毒株 。
在对HIV的研究中 , 研究人员发现 , 该蛋白的V1-V2高变区域有许多可能的逃逸突变 , 这与之前的研究结果一致 , 他们还发现了逃逸概率较低的序列 。
该模型对冠状病毒的分析表明 , 被称为S2亚基的刺突蛋白的一部分最不可能产生逃逸突变 。但新冠病毒变异的速度仍是一个问题 , 因此目前部署的抗击新冠肺炎大流行的疫苗在多长时间内保持有效性尚不清楚 。
“目前 , 对于新冠病毒 , 我们认为该模型可以迅速标记出与以前看到的病毒序列有本质区别的新序列 , 以便在实验室进行下一步测试 。” Berger告诉《中国科学报》 , “你可以想象 , 模型能检查每一个新序列 , 而改变超过一定阈值的序列就需要在实验室中展开进一步研究 。”
初步证据表明 , 这种病毒的变异速度不像流感或HIV那么快 。然而 , 研究人员最近发现了在新加坡、南非和马来西亚出现的新突变 , 他们认为应该对潜在的病毒逃逸进行调查 。
研究人员认为 , 目前面临的问题仍然是新冠病毒的变异速度有多快 。
“该病毒种类繁多 , 控制其复制的生物机制因人而异 , 所以尽管它们有共同的特征 , 但仍需要对每种病毒进行专门研究 , 以了解其突变率 。”Bryson说 , “我们最好的见解将来自于动物感染模型 , 其中完整的免疫反应是存在的 , 因此可以理解总的免疫压力是如何影响病毒突变率的 。之后 , 我们需要对新冠病毒感染者的病毒进行测序 , 以识别这些病毒中存在的突变 。”
此外 , 研究人员现在正与其他人合作 , 利用他们的模型确定癌症疫苗的可能目标 , 从而刺激人体自身免疫系统摧毁肿瘤 。他们说 , 该模型还可以用来设计小分子药物 , 这种药物可能不会引发结核病等疾病的耐药性 。(唐凤)
推荐阅读
- 面试自我介绍加分技巧(面试自我介绍加分的方法)
- 苹果微信怎么加应用锁(苹果微信加应用锁怎么做)
- 汉语言学是学什么的(汉语言学学习的课程介绍)
- 失眠发朋友圈的语言(有关失眠发圈的话语介绍)
- 高情商的感谢语言(高情商的感谢的句子精选)
- 皖北|语言文化,饮食习惯相似的皖北与苏北,为什么没有选择“在一起”
- 苹果炉石传说总提示前往应用商店怎么办(苹果炉石传说怎么下载)
- 伤害人的语言说说心情(语言伤人的说说心情)
- 论文合著|每个月消失一种,本世纪末1500种语言或不再使用
- 微信如何查看授权的应用有哪些(怎么查看微信授权哪些应用)