BG视讯

国家生物信息中心研发新冠病毒高危害变体早期预警算法

自新冠肺炎疫情暴发以来,新冠病毒一连演变,新泛起的高危害病毒变体可能突破现有疫苗与抗体的防护屏障,因而需要一直调解防控战略以应对可能的危害,因此,准确且实时地预警高危害变异株对疫情防控至关主要。

10月15日,国家生物信息中心宋述慧团队等基于全球果真宣布的全基因组序列,研发了新冠病毒高危害变体早期检测预警的机械学习算法HiRisk-Detector,为全球新冠疫情的精准防控提供了高危害变体监测预警的要领手艺支持。

团队基于前期已建设的新冠病毒信息库(Genomics Proteomics Bioinformatics 2020,?2023)和自主研发的海量基因组大数据单体型网络快速剖析算法McAN (Briefings in Bioinformatics 2023),通过构建并提取一连时序的单体型演化网络特征,经差别机械学习模子和最优特征组合的测试,构建了高危害变体监测预警算法HiRisk-Detector。团队使用凌驾760万条高质量且完整的新冠病毒基因组及其元数据,验证了HiRisk-Detector的有用性、稳健性和泛化能力。首先,回首性研究批注HiRisk-Detector可预警到天下卫生组织WHO已报道的所有13种高危害变异株,其预警时间比WHO官方宣布的时间平均提前27天,验证了其早期预警的有用性。其次,将测序强度抽减至实丈量的四分之一,预警仅延迟3.8天,证实晰该算法的稳健性。最后,HiRisk-Detector还可应用于对新冠病毒奥密克戎子支系的危害预警,其ROC-AUC和PR-AUC等性能指标均高于0.92,展示了该算法的普遍适用性。总之,HiRisk-Detector具备了高危害变异株早期自动化预警能力,对新冠病毒及其他新发突发熏染病防控具有主要应用价值。

HiRisk-Detector算法的源代码已在BioCode?与GitHub 两大平台果真宣布,用户可免费下载获取,并可在新冠病毒信息库RCoV19的高危害变体预警?直观浏览追踪HiRisk-Detector的历次预警效果。

上述研究效果以“Machine learning early detection of SARS-CoV-2 high-risk variants”为题在国际学术期刊Advanced Science?在线揭晓。国家生物信息中心李论助理研究员、李翠萍高级工程师和陆戎衣甲兵学院李娜讲师为论文的配合第一作者,宋述慧研究员、鲍一明研究员、章张研究员和薛勇彪研究员为论文的配合通讯作者。该研究获得国家重点研发妄想、“一带一起”国际科学组织同盟ANSO团结研究相助专项、北京市科技新星妄想等项目的支持。

BG视讯·大游(集团)官方网站

HiRisk-Detector算法示意图

论文链接


附件下载:
【网站地图】【sitemap】