美高梅彩票网投平台平台基本赴中科院Hong Kong基

作者:美高梅彩票网投平台-教育资讯

2019年5月9日,国家科技基础条件平台中心苏靖主任一行赴中国科学院北京基因组研究所就科学数据工作开展调研,平台中心王瑞丹副主任、中科院办公厅王树志副主任、基因组所王丽萍书记等参加了调研。

2018 年、2019 年连续两年,组学数据库权威杂志《核酸研究》对前一年的全球基因组数据库建设进行总结,鲜见地在美英两个老牌的数据库以外,提到了中国的 GSA。

新华社北京3月8日电政府工作报告提出,国家科技投入要向民生领域倾斜。全国政协委员、中国科学院北京基因组研究所所长薛勇彪8日表示,生命健康大数据是关系到国家人口健康和生物安全的重要基础资源。当前亟待加快建设国家级共享平台,存好、管好、用好生命健康大数据。

近年来,中国科学院北京基因组研究所面向我国人口健康和社会可持续发展的重大战略需求,积极建设生命与健康大数据中心,汇集了来自中国、巴基斯坦、泰国、伊朗、英国、美国等共计1000T的数据资源,打造基因组学大数据汇交、应用与共享平台。调研中,基因组所相关负责同志重点围绕国际生物信息数据共享现状、基因组数据中心建设以及数据安全等方面开展的工作进行了汇报。调研组与专家学者就加快落实《科学数据管理办法》相关要求,规范基因组学领域科学数据管理,提升科学数据对科技创新和经济社会发展的支撑保障能力等问题进行了深入研讨。

“美国国立生物技术信息中心和英国欧洲生物信息学中心30 多年前已经开始建立,我们的 GSA 是 2015 年底才上线运营的。” 国家基因组科学数据中心主任鲍一明介绍,中心的组学数据库之所以能够得到权威杂志的认可 “点名”,一方面是由于数据量增长快,另一方面是数据的可用性、标准化方面的工作均与国际接轨。

有效利用生命健康大数据有助于推动精准医学研究,催生医疗模式变革。“随着健康中国战略的实施和健康医疗技术的不断发展,生命健康领域数据迎来爆发式增长,预计今后五年我国将产生300PB以上的基因组数据。”薛勇彪说。

基因组等生命科学大数据是关系到国家人口健康和生物安全的重要基础资源。随着健康中国战略的实施和健康医疗技术的不断发展,基金组学领域数据迎来爆发式增长。如何有效的收集、挖掘利用好这些数据是今后的重点工作。调研组提出,下一步要加快落实《科学数据管理办法》,通过多元的数据收集新方法以及互利共赢的数据共享新机制,加快完善基因组学等生命科学大数据的汇交、管理、共享、应用体系,加强生命科学领域的数据中心建设,提升数据中心的国际影响力,推动数据中心在维护数据主权、保障数据安全、加速数据应用等方面做出更大贡献。

据了解,针对我国基因组学数据 “存管用” 的实际需求,解决数据孤岛等重大问题,科技部、财政部共同支持组建国家基因组科学数据中心,依托中国科学院北京基因组研究所,联合中国科学院上海营养与健康研究所和中国科学院生物物理研究所共同建设。中心的科学数据专业化团队,对外提供基因组学数据统一存储、整合挖掘、共享应用的一站式数据服务。

薛勇彪调研分析发现,我国生命健康数据面临两大“痛点”。一是流失严重。国际学术期刊通常要求论文递交者把发表的数据在学界认可的数据库公开。由于国内缺乏生命健康大数据管理公共平台,我国学者大部分的数据都只能递交到美国NCBI和英国EBI等国际知名数据库。据估计,NCBI数据库中30%以上的数据来自中国。二是“孤岛”现象严重,利用效率低。由于缺乏管理共享机制,宝贵的生命健康数据分散“沉睡”在实验室和机构内形成数据“孤岛”,严重制约我国生物大数据的转化应用。

顺应大健康需求,构筑自主数据基础

“生命健康大数据是现代生命科学产生新知识、提出新假说、开发新应用的引擎,是支撑我国‘健康中国’战略的重要基础性战略资源。”薛勇彪呼吁,加快建立国家级生命健康大数据共享平台。

“之前,中国已成为基因组数据产出大国, 但未能形成国家级公共数据资源。” 鲍一明介绍,面向国家大数据战略发展需求,国家基因组科学数据中心围绕人、动物、植物、微生物基因组数据,重点开展了数据资源及数据库体系建设,并开展了数据服务、系统运维、技术研发、数据挖掘等系列工作。目前,国家基因组科学数据中心已拥有自主知识产权的基因组数据汇交、管理与共享系统,保障数据安全性,支撑并服务于国家重点研发计划、国家自然科学基金、中科院先导专项等 300 余个科研项目的数据存储、管理和共享。

薛勇彪认为,这个共享平台应面向我国人口健康和经济社会发展的重大战略需求,通过多元主动的数据收集新方法、互利共赢的数据共享新机制、高效智能的数据解析新技术,建立生命健康大数据的汇交、管理、共享、应用体系,维护数据主权、保障数据安全和加速数据应用,服务科研院所、高校、医院、企业和广大人民群众,为我国经济社会发展和人民生活改善做出重大贡献。

在生命科学研究领域,研究者获得的基因组学数据,均需上传到专业数据库,方可在杂志上发表。如今,我国已拥有获得认可的组学数据库,这将大大提高中国高水平论文被接收过程的便捷性。“中国的学者不需要再将数据‘飘洋过海’传输到海外,可以获得更加专业化的中国式服务。我们的平台已被多家国际顶级杂志认可,中国学者将数据提交到 GSA 系统,其发表的论文已经被多个国际知名期刊所收录,这包括 CNS、美国科学院院刊等。”鲍一明说,这为 “用好科技资源、支撑创新发展” 提供了基础。

美高梅彩票网投平台 1

截至 2019 年 8 月,国家基因组科学数据中心已为国内外 150 多个单位提供免费数据存储服务,累计用户递交项目信息超过 1200 个,用户提交的测序数据量超过 1.2PB,收集并存储的数据总量超过 4PB,数据上传下载量日均达到 1TB。

与国际接轨,不做信息孤岛

生物信息的数据要海量整合后才会有价值,割裂的数据库只完成了 “存” 却难以走向“使用”。例如对人类组学数据的整合和挖掘将更全面地获得人类健康问题的解决方案,避免“盲人摸象”。

这正是国家基因组科学数据中心成立的初衷和建设的方向。在科学数据共享方面,科技部长期致力于打破条块分割,对相关部门和行业长期持续积累的数据资源,以及对国家科技计划项目的数据进行整理、汇交和建库,同时提高与国际科学数据组织的信息交换能力。

2019 年,我国国家基因组科学数据中心组学数据库被国际著名出版商 Elsevier 收录为指定基因数据归档库,其权威性得到国内外 100 余家学术杂志的认可。国家基因组科学数据中心已经成为有国际影响力的基因组科学数据中心。

目前,国家科技基础条件平台中心正在组织国家科学数据中心编制五年建设运行实施方案。未来,国家基因组科学数据中心将继续围绕基因组科学研究前沿及数据的存管用需求,逐步完善中心组织管理架构与运行机制,强化队伍建设,培养复合型数据人才;建立数据共享、质量控制、安全管理等标准与规范,利用云计算、人工智能、机器学习等先进技术,提升数据储存、管理、挖掘与共享能力;发展数据加密、解密、分级管理、受控访问等数据安全关键技术,建立人类遗传资源数据管理体系,确保国家重要生物资源数据本地化存储、管理与共享利用。

鲍一明表示,希望经过 5 年努力,建成汇聚海量科学数据、服务万家机构、引领大数据技术创新的国际一流基因组科学数据中心,切实解决我国基因组数据存管用难、数据流失严重、核心基因组科学信息资源先 “出口” 再“进口”的问题,不断提升我国在基因组学大数据领域的国际话语权。

本文由美高梅彩票网投平台发布,转载请注明来源

关键词: