|
|
国际前沿 |
科学数据共享管理:问题及对策 |
关键字:数据共享
时间: 2004-05-12 点击率: 1117970 |
摘 要: 所谓科学数据,一般指各类科技活动产生的原始性、基础性数据及按照不同需求加工后的数据集和相关信息,它既包括各部门大规模观测、探测、调查和试验工作所获得的长期积累和整编的海量科学数据,也包括广大科技工作者长年累月的研究工作所产生的大量科学数据。
|
所谓科学数据,一般指各类科技活动产生的原始性、基础性数据及按照不同需求加工后的数据集和相关信息,它既包括各部门大规模观测、探测、调查和试验工作所获得的长期积累和整编的海量科学数据,也包括广大科技工作者长年累月的研究工作所产生的大量科学数据。我国是一个数据大国,拥有大量的科学数据,但不是一个数据强国,科学数据利用率很低。只有对数据实行联合共享,才能真正实现其潜在价值。而对科学数据进行共享管理,其实质就是实现科学数据这一特殊的社会公共资源的最大价值,为全社会服务。
1 我国科学数据共享管理现存问题
1.1 科学数据应用与共享的立法还是空白。科学数据是知识财产,而在科学数据应用与共享中产生的法律问题就是知识财产保护与公益性事业发展的平衡问题。特别是对非营利性的科学研究、教育和决策领域的应用和共享问题尤其突出。此外,有一些科学数据直接与经济发展、国家安全甚至个人隐私有关,相关联的法律问题也是新问题。例如:科学数据共享与科学数据保护的法律问题,科学数据共享与国家安全的法律问题,科学数据共享与个人隐私的法律问题等,而这些问题在国际上也是空白或不完善的领域。
1.2 科学数据管理条块分割,缺乏国家层次的宏观管理和协调,相关的政策没到位。到目前,国家各类科技计划还没有建立有效有序的数据汇交、共享管理制度,基本上是科学家“各自为战”和科学研究项目“各项目组为战”,科学数据分别保存在专家、众多的部门和单位手中,出现一个单位科学家之间共享数据比外单位难,从国外可以免费共享的同类数据,在国内却需高价的现象比比皆是。由于数据共享相关政策没到位,共享积极性不高,数据分散、失落现象非常严重。尽管形成数据产品的很少,可还是低层次重复开发的多,浪费严重。有关部门和科研单位曾对青藏高原进行了多次大规模调查、观测、探测与深入研究,取得了大量科学数据,但由于缺乏有效的管理和协调,相关政策没到位,部门、单位和科学家之间缺乏数据、资料的充分交流与共享,对青藏高原整体的研究和认识仍显得相当不够。
1.3 缺少合适的科学数据共享技术平台,没有完善的数据交换标准、规范、质量控制和信息服务系统,给科学数据共享带来了不应有的麻烦。我国不少国家科技计划项目直接用于获取数据的支出高达项目总经费的50%,即使这样,由于缺少合适的数据共享技术平台,项目结束后,科学数据、资料和相关信息或依然处于离散分布而丢失损毁,或未能系统整理而无法共享,没有充分发挥其应有作用。
1.4 由于投入不足等原因,大部分数据服务机构没有能力和实力开发系统的科学数据产品,数据共享更是举步维艰。目前一些部门已建成的数据库,还难以有效支撑我国的经济建设和可持续发展要求,确实能为相关行业的持续发展产生有效支撑的还不足已有数据库总量的10%,而一些领域的基础性、公共数据库,要么难以建立,要么难以为继,缺乏系统性而变成“死库”。
2 搞好科学数据共享管理的对策
2.1 建立一套完整的科学数据共享管理法规政策体系。为使科学数据共享工作有法可依,应尽快制定相关的科学数据共享法规与政策。包括尽快起草关于科学数据共享的管理条例,制定有关国家科学计划项目所产生数据的汇交管理办法等。在政策方面:一是对于国家长期固定投资使之从事某些专项领域(如气象、水文、地震)的数据采集与数据生产的组织,国家应当制定明确的政策,使这些机构或组织生产的数据成为数据共享的主要数据源,至少是公益性数据共享的数据源。对于企业投资产生的科学数据,应纳入到市场运作。二是要有一套鼓励数据共享的政策措施,以保护数据提供者的利益。如:被提供服务者为最终用户的,对数据不具备散发权;数据提供者在被提供服务者的研究成果中有署名权等等。此外,不论数据本身是免费还是有偿的,都应当允许数据服务的提供者收取适当的工本费和服务费,以维持数据共享服务的正常运转。
2.2 从国家发展的战略高度,加强对科学数据共享的总体规划与组织管理,多部门、多学科、多单位整体协调,统一部署,共同推进。科学数据共享是一项长期的、涉及国家科技创新体系建设的重要工作。因此,要实施国家层面上的科学数据共享,首要的工作是对我国科学数据共享从国家发展的战略高度进行调整。将科学数据共享变科学家个人行为、项目组行为、行业行为为国家行为。在我国科技发展规划的总体布局中,变国家单纯抓项目为国家为全社会建立科技可持续创新的环境和科研项目并举,实现科学数据的持续积累、有效汇交和良性更新。只有这样,才能把科学数据这项宝贵的国家信息资源从狭隘的单位、部门或个人所有中解放出来,形成国家数据中心和部门数据中心相结合的集中与分布式、多级纵横的共享结构,才能真正使科学数据的共享成为我国科技竞争能力提高的有效支撑。
2.3 制定科学数据标准,以互联网为载体构建科学数据共享的技术平台,最大限度地提供共享服务。科学数据只有在充分流动和共享中才能体现出它的科学价值、经济价值和社会价值。为此,国际科学联合会的两大科技数据组织?D?D世界数据中心(WDC)和国际科学技术数据委员会(CODATA),利用国际互联网初步构建了全球尺度的科技数据交换体系。一批全球性数据共享工程已经建成,200多个空间数据交换中心已在国际互联网上提供服务。海洋、气象、地震等国际组织均遵循“平等、互惠、互利”的原则开展数据共享服务。我国由于缺乏相应的数据标准,数据缺乏有效的处理加工,所以互联网主要还是用作公司、企业、组织的宣传、介绍以及公共免费信息的查询和检索的平台,很少用来进行数据的共享与服务。因此,参照国际数据标准制定我们的相应标准,以互联网为载体构建科学数据共享的技术平台,是实现科学数据共享管理和服务的重要基础。
2.4 在科技投入结构方面进行调整,以保障长期、稳定、足额、及时到位的经费投入,在项目合同中规范数据产权关系和数据汇交行为。美国联邦政府在科学数据共享经费管理上采用投资和签订合同的方式来确保主要的科学数据能够汇集到国家级数据中心来管理和散发。这样做主要是考虑到科学数据的复杂性,政府不可能拿出一个法律上可以量化、对各个项目均可行的数据汇交指标。如果仅规定科学研究产生数据建立汇交制度,但是这个制度不能具体指出什么数据、多少数据上交的话,数据上交制度就不容易在司法层面上确定法律责任,数据汇集工作难以操作。如果采用每个项目通过政府投资、同时与政府签订合同的方式,在合同中明确规定什么数据、多少数据,以什么方式上交,上交的时间、上交的单位、数据相关各方的产权关系等,这就用合同的方式保障了国家投资科研项目产生的各种不同类型的数据可以汇集到国家级数据中心并实施共享。在我国,由于长期以来没有稳定的科学数据共享投资,因此,我国应该在国家科技投资结构方面做调整,以建立稳定的投资渠道。在科学数据共享工程建设的前5年,国家在科学数据共享方面的投入应占我国科技总投入的10%~15%,5年之后,随着科学数据量的增大和科学数据的普及,国家的投入比重还应增大。另一方面,为保证国家投入产生的科学数据不流失、有序和规模管理,我国也应在科学研究项目合同书上增加数据共享管理内容,包括数据汇集内容、时间、方式等,以合同的方式保证科研项目数据在国家规划的数据中心的汇集。
2.5 明确科学数据共享管理的运行机制。严格区分投资来源和数据的产权性质是美国科学数据纳入哪一种机制运行的最主要的标准。由国家投资产生的数据应该全民受益;由公司投资开发的数据,公司理所应当获得利益。在我国,虽然在保障国家安全的保密性管理机制方面是成功和有效的,但是,在公益性和产业化两种机制的划分上就不十分清楚,其中最主要的问题是对科学数据的产权划分不清楚。很多科学数据由国家投资产生,数据生产者却把它当作小集团的财产,纳入市场机制获得利益,并且将这些利益通过不同的方式作为这一小部分人的劳动补贴。因此,我国需要在科学数据管理机制上进行调整。调整的重点应该是在国家保密机制基础上,根据投资者的不同,区分公益性和商业化两种不同的运行机制。即:对国家投资产生的科学数据和数据产品,应实行完全、开放的无偿共享;对企业或个人投资产生的科学数据和数据产品,应实行商业化运行,实现有偿共享,并积极探索商业性科学数据有偿服务的共享管理模式,努力培育科学数据产品市场和数据产品服务产业。
2.6 引进国际数据资源。国际组织通过不同渠道畅通了一系列的数据共享通道,这给我国利用国际数据资源提供了良好的机会。而目前,我国对国际数据资源的利用率很低,这是一个很大的浪费。因此,我国应从国家层面上通过国际组织和双边、多边合作,建立国际科学数据资源引进和集中的渠道,这样既可以节省资金、人力、时间,同时,也可以将国际数据承载的数据标准一并引入国内。
实施科学数据共享,建立以国家科学数据库群为核心的数据共享平台,实现科学数据的持续积累、有效汇交和良性更新,不是一个行业、一个部门或者某个人一个阶段的事情,它需要国家与全社会的联合推动和长期努力。因此,应在政府的合理引导和有效监管下,依托共同的数据共享标准和管理体制,立足现有各部门、各单位的业务范围,以及科学数据的不同类型、性质、作用、投资渠道和安全要求的差异,对不同类型、不同时期的科学数据,采用不同的管理政策和管理模式。惟如此,才能为实施科学数据共享创造合理、良好的运行机制,也才能使海量的科学数据资源的潜在价值在广泛应用中得以充分发挥和增值。
--------------------------------------------------------------------------
[作者:郑淑荣 赵培云]
[来源:《中国科技成果》2003.23 中国科学技术信息研究所加工整理]
参考文献
[1]张景勇.让“1+1>2”[N].经济参考报,2003-6-6.
[1]刘闯,孙鸿烈.国际科学技术数据前沿领域发展研究[J].辽宁科技参考,2003(5):-26-28.
[1]刘闯.美国国有科学数据共享管理机制及对我国的启示[J].辽宁科技参考,2003(5):-29-31.
|
|
|
|
|