国家生物信息中心宣布基因序列数据库GenBase
基因的序列和注释信息(包括DNA、RNA和卵白序列信息)是支持基因功效研究的焦点基础数据之一。陪同生物学的迅猛生长,在已往几十年中,我国生命科学领域产出了海量的基因序列数据。为知足我国科研职员在基因序列数据汇交、治理和共享历程中的现实需求,急需开发响应的基因序列数据库。
克日,国家生物信息中心宣布基因序列数据库GenBase,并以“GenBase: A Nucleotide Sequence Database”为题在学术期刊Genomics Proteomics Bioinformatics?在线揭晓。
GenBase对标美国国家生物信息中心NCBI的GenBank数据库,是一个存储、治理、共享所有物种基因序列、注释信息及其编码卵白质序列的公共资源库,可为基因序列数据的汇交、存储、宣布和共享提供一系列Web服务;贕enBase的提交系统,用户可凭证详细的操作提醒,按办法提交包括提交者信息、参考文献、核苷酸序列、数据泉源、数据特征等在内的主要的实体和元数据信息。GenBase严酷把控数据质量,包管基因序列数据的准确性、完整性和可用性。GenBase系统遵照国际核酸序列共享同盟(International Nucleotide Sequence Database Collaboration,INSDC)的相关标准,驻足中国,服务全球,可吸收来自全球科研职员的数据提交。阻止到2024年8月1日,GenBase共吸收了来自197个单位、309个用户、2,650个批次的81,929条核酸序列及832,740条卵白序列。其中,76,340 条核酸序列(93%) 与723,863 注释的卵白序列(87%) 已释放,支持了51篇论文的揭晓。特殊地,GenBase吸收了63,006条新冠病毒序列,其中的 59,913条已释放。同时,为包管全球基因序列数据的外地化治理,GenBase还整合了INSDC宣布的约5.8亿条核酸和卵白序列,提高海内科研职员盘问和获取数据的效率。
国家生物信息中心卜琮凡、郑欣畅、赵学彤、徐添翼、白雪为该文配合第一作者,唐碧霞高级工程师和鲍一明研究员为该文配合通讯作者。本事情获得了BG视讯战略性先导专项、国家重点研发妄想、“一带一起”国际科学组织同友邦际专题网络、BG视讯国际相助项目“国际基因组学数据共享系统研发”和国际生物多样性与康健大数据共享妄想的项目支持。
论文链接
GenBase整体架构