利益相关者视角下数据出版相关机构的角色和互动机制研究
Research on the Roles and Interactive Mechanism of Data Publishing RelatedInstitutions from a Stakeholder Perspective
作者简介
唐佳,辽宁大学信息资源管理学院硕士研究生,研究方向为学术出版、科研数据管理。
摘 要:科学数据的出版已经成为科学数据开放交流实践中最重要的传播方式之一。科学数据出版离不开机构的支持,机构推动开放出版能够从中获利并造福科技进步。文章从利益相关者的角度出发,探寻不同学术机构在数据出版中承担的角色和任务并发现他们之间的多元关联。研究发现,在数据出版中应当发挥数据产出机构的互动保障作用,完善数据发布机构的数据整合作用,推进社会公众、科研机构等与数据出版商的互动对话,发挥政府相关管理部门和行业协会的互动引导作用,多元化紧密参与模式是相关机构未来参与数据出版的趋势。
关键词:数据出版;利益相关者;开放获取;科研数据开放
1.引言
开放科学将带来科学研究的重大革命,引起了全球科学界的广泛关注。自2001年12月开放社会基金会(Open Society Foundations)提出《布达佩斯开放存取计划》[1],论文与数据开放的路程就此开启。2021年,联合国教科文组织审议通过《开放科学建议书》[2],标志着开放科学迈入全球共识的新阶段。欧洲研究理事会2022年发布《开放研究数据和数据管理计划》[3]时,开放科学已形成蓬勃发展之势。在国内,数据开放也备受关注。2018年,国家标准化管理委员会发布《信息技术 科学数据引用》国家标准,2019年2月中国科学院印发《中国科学院科学数据管理与开放共享办法(试行)》[4],为进一步加强科学数据管理,提高科学数据开放共享水平提供了制度规范,数据的开放共享已成为时代的大趋势。2023年9月由科技部提出,全国科技平台标准化技术委员会、国家科技基础条件平台中心组织制定的《数据论文出版元数据》发布[5],既是对现有规范的完善,也为下一步的发展指明了方向。2023年12月14日第四届“数据驱动知识发现”研讨会上,中国科学院文献情报中心与中国教育图书进出口有限公司宣布“开放获取资源评价”联合实验室正式成立,将探索一系列针对开放获取资源的评价标准体系[6],进而提高开放资源的质量,构建更好的资源环境。开放数据对当前各国经济发展和知识型社会建设起到关键作用[7]。
数据出版是共享科学数据的一种方式,用“出版”的方式将数据公开发布出来,能够最大限度地发挥研究数据的影响。目前学界尚未对数据出版有明确的概念界定,本文参考不同方面的意见[8-10],将数据出版定义为科研人员与科研机构按照统一规范的质量管理和控制机制,通过互联网公开发布科研过程产生的原始数据、数据集以及对数据修正、更新、评论的数据内容,以帮助发现、获取、理解和再分析利用数据,以数据开放、共享为基本出发点。
数据出版包含传统出版中的“评审、发布、存档、可引用”等含义,这使得数据成为科研成果,可以被纳入科研评价体系,保障数据生产者的权益,提高数据生产者共享数据的积极性,也使开放数据有更高的质量保障,更符合学术规范并能降低相关研究的成本[8]。
数据出版离不开相关机构的支持。学界从各角度对数据出版相关机构进行了探讨,当前对数据出版相关机构的研究包括数据期刊[8,11-12]、出版商[13]、高校图书馆[14]等。相关机构在研究中更多作为研究某一对象的载体,比如通过对国内外主要出版商、代表性期刊和数据期刊及存储库的调研获取出版政策要素[15-16];以学术出版商和科技期刊为例[17-18],探讨实践状况中科学仓储的出版流程研究[19];以欧盟《通用数据保护条例》(General Data ProtectionRegulation, GDPR)为例,探讨数据保护问题[20];涉及多个机构在开放科研数据中的作用阐述[21]等。
总体而言,当前对于数据出版相关机构的研究相对独立,还未关注到机构之间其实存在着密不可分的关系,截至2023年12月,Re3data显示全世界共有3 179个开放数据存储仓储,涵盖88 个国家和地区,拥有数据仓储最多的国家是美国,其次是德国、英国。学科数据最多的是生命科学,占比较高的是生物学、医学、自然科学等[22],数据的开放出版已经在世界范围内具有很大规模。要实现数据出版的全流程稳定高效运行离不开各机构之间合作共创,本文从参与数据出版的主要机构出发,通过网络调研国外发展较为完善的大型机构,总结各机构之间存在的联系以及当前世界范围内数据出版的趋势,为今后国内数据出版的发展提供参考建议。
2.数据出版利益相关者的界定
1963年,美国斯坦福大学研究小组提出利益相关者理论[23]。1984年,弗里曼明确提出组织中的利益相关者是指能够影响公司目标的实现,或者受公司目标实现影响的团体或个人[24]。20世纪90年代以后,利益相关者理论与模型逐步被应用至政府管理、社会治理以及城市管理、旅游管理、图书情报等领域。将利益相关者理论引入数据出版领域可为数据出版的战略规划设计提供分析视角,也能够较为全面地认识数据出版的利益相关者,有利于综合考虑数据出版相关利益主体的利益诉求,促进互动与合作[25]。
科学数据的生产、组织、发布、传播与利用对利益相关者的界定有一定参考作用。根据2019年1月9日瑞典开放存取期刊目录(Directory of Open AccessJournals, DOAJ)发布的调查报告,DOAJ中最常见的出版机构类型包括高校、出版商、科研院所和社会团体等[26]。盛小平等人[27]将科学数据开放共享活动中的利益相关者总结为政府、研究机构、研究资助机构、图书情报机构、数据中心、行业协会、出版社、研究人员、其他企业、用户、社会。樊俊豪[28]认为科研数据管理服务主体包括政府和基金组织、研究者和研究机构、数据中心、数据出版机构、IT部门等利益相关主体。通过总结各方观点,笔者将数据出版的利益相关者概括为科研人员、政府、高校、学术出版商、科研院所、资助机构、社会公众、行业协会、期刊(见图1)。
图 1 数据出版的利益相关者
在数据出版中,科研人员和社会公众是数据的产出者、利用者、再利用者。数据的产出是数据出版的核心条件,高校、行业协会、科研院所、期刊、学术出版商、政府、资助机构则保证数据出版的顺利进行和平稳维护,开放科学环境为数据出版创造了条件与氛围。
数据出版中涉及的利益相关者分别具有一定的获得利益和产出利益。获得利益是指利益相关者在参与数据出版活动时所获得的宏观利益及微观利益:宏观利益是指对社会、机构、行业等具有正面和长远发展影响,包括提升国家整体开放科学水平、提高经济效益、提升机构的社会地位以及行业出版与共享水平等;微观利益指个人能从数据出版中获得的利益,包括无限制获得科学数据用于科学研究、提升个人学术影响力、获得出版资助、促进个人对数据价值的认识等。产出利益是指各利益相关者在数据出版活动中作出的贡献,也就是指为实现数据出版,在数据生命周期全过程保证科学数据的规范化和完整性,具体包括生产科学数据资源、建立科研数据管理平台与机构知识库、建立数据与论文之间的关联、制定数据管理引用规范、出版数据及数据论文、开展活动提升数据出版概念接受度等。获得利益和产出利益是利益相关者行动驱力的来源,同时也形成促进数据出版系统得以运行的正向循环。明确利益相关者的获得利益和产出利益有助于理解其行为动机,对其是否能够作为数据出版的利益相关者作出进一步验证,数据出版中利益相关者的获得利益和产出利益的具体体现如表1所示。
表1 利益相关者的获得利益和产出利益
3.数据出版相关机构的作用
3.1 学术出版商
以Wiley为例,Wiley作为世界第三大出版商,拥有500多本金色开放获取①期刊和1 400多本提供开放获取选项的混合型期刊,占其全部期刊的95%,涵盖120多个学科。Wiley积极推进开放获取和数据出版,主要实践方向包括创建数据期刊、承担宣传责任、与学术团体和政府密切合作、为用户提供专业服务四个方面。
(1)创建数据期刊。Wiley在2012年7月16日推出Geoscience Data Journal。该期刊仅以在线方式发行,主要发表短篇的地球科学数据论文,论文存放在经认可的数据中心的数据集,并与唯一标识符关联。具体而言,Geoscience Data Journal的数据文章需要对数据集进行描述,并详细给出数据来源、处理过程、使用的软件和数据文件类型等。该期刊采用CC BY许可②,允许用户复制、分发和传输文章,改编文章并将文章用于商业用途。截至2023年12月,Wiley已经有587本金色开放获取期刊,今后仍有计划推出未探索领域的数据期刊。自2012年以来,Wiley将80多种期刊从订阅模式转变为开放获取模式,其中自然包括文章及与其相关数据的开放,并将持续推进混合型期刊转变为完全开放获取期刊。
(2)组织活动讲座,承担宣传责任。2023年9月,Wiley联合中国科学院文献情报中心策划组织了系列开放科学活动,以开放获取、开放数据、开放平台等开放科学实践形式为主题,交流分享开放科学的实践、经验和洞见,探讨开放科学对促进科学合作的重要作用。例如,其中一期主题为“开放数据体系构建与出版实践”探讨了关于数据出版的政策、问题、可持续发展等。该活动除了在Wiley官网上直播外,也同时在哔哩哔哩弹幕网(B站)上直播,并设置在线提问环节,促进讨论的进一步深入。
(3)与学术团体和政府密切合作。Wiley当前已经与850家协会开展合作,出版合作伙伴成员遍布世界各个地区,主要包括有:中国科学院、中国社会科学院、美国人类学协会、美国癌症学会、美国金融协会、澳大利亚生态学会、欧洲微生物学会联合会、德国化学会等,其中与英国工程技术学会(TheInstitution of Engineering and Technology,IET)建立开放获取期刊出版的合作关系,推动期刊出版向金色开放获取模式转变。此外,Wiley还参与多方面的支持工作,如支持国家和国际层面的工作、帮助制定政策和开放获取协议、与全球诸多国家发展合作关系、宣传开放获取理念[30]。
(4)为用户提供专业服务。Wiley开发了多种不同平台,涉及数据出版的资源、出版相关问题科普等。例如,线上图书馆,将其所拥有的所有资源包括期刊、图书、数据库等集合在一起,是数据出版内容面向社会公众的另一平台。还有中文博客节目Wiley科研谈,邀请学术出版行业的参与人员分享出版、科研的经历。还为用户提供全方位解决论文写作投稿问题的Wiley在线讲堂。所有的内容都基于共享的原则免费向公众开放[31]。
3.2 期刊
3.2.1 数据期刊
数据期刊指的是发表数据论文和数据的期刊,着重于描述实验和观察数据,有效整合传统学术论文的内容和结构,帮助用户进行检索和数据挖掘[32]。数据期刊包括完全数据期刊和混合数据期刊。完全数据期刊指的是全部发表数据文章的期刊,混合数据期刊则将“数据论文”作为一个子栏目。数据期刊的出版模式分为三种:一是出版短数据论文的数据期刊,其特征为篇幅简练、不对原始数据集进行分析研究、开展同行评议保证质量、以集成统一方式进行管理;二是以整合出版为特征的数据期刊,其特征为对数据和论文进行集成出版,注重研究论文和数据之间互操作的简便性;三是数据作为补充资料出版的数据期刊,其特征为出版学术论文的同时出版原始数据或数据集[33],与集成出版的不同之处在于学术论文与数据是各自作为独立的一部分出版的。除了数据论文,数据期刊也会发表其他类型的文章:数据服务论文(Data Service Paper)用于描述产生或分析数据的平台、方法、工具等,提高用户利用数据的效率;简报型论文(Short Communication)描述已存在数据集的更新情况,一般篇幅较短;数据集方面的综述(Review),对已发表的文章进行简短评述(Comment),不同的文章类型呈现了数据的不同状态,让用户对数据有更全面清晰的认识。
3.2.2 传统学术期刊
传统学术期刊在开放获取的大环境下也将学术论文进行开放,并加入数据出版内容,借鉴数据期刊的出版模式,采用整合出版或集成出版的方式将数据引入传统出版流程中,逐步转向混合数据期刊。传统期刊近年来也在推出新的数据期刊,如2018年《美国医学杂志》推出《美国医学会杂志网络开放》。也有一些期刊从混合型转向完全开放,EMBO出版社的Molecular Medicine于2012年成为首批转化为完全开放获取的期刊;2010年Nature推出的混合型期刊Nature Communications在2016年转为完全开放获取期刊;Life Science Alliance期刊于2019年成为开放获取期刊。由此可见,传统学术期刊正逐渐向完全开放获取的数据期刊转变。传统学术期刊与数据期刊共同承担数据的正式发布与共享功能,是用户获取科研数据的重要窗口。
3.3 高校、科研院所和行业协会
3.3.1 建立数据库与数据服务
哈佛大学定量社会科学研究所、哈佛大学图书馆和哈佛大学信息技术组织于2006年合作启动Dataverse项目,开发开源数据库。该项目的目标包括:发展全球Dataverse社区;培养处理复杂数据和大数据的能力;扩展现有和新的学科数据;加强存档和保存功能;提高互操作性;改善用户体验等。该数据库以服务性为主,为数据开放出版提供坚实的技术支持,目前在全球与108个机构合作,依托高校图书馆及信息服务部门等提供数据服务,并在世界范围内搭建全球Dataverse社区联盟,在国内,北京、上海、香港、台湾均与Dataverse有合作。除了提供技术支持外,该项目还与其他的数据库合作,如与美国国立卫生研究院(National Institutes of Health,NIH)的数据科学战略办公室及其他五个数据库合作,共同启动新的数据管理和共享计划,其中,美国国立卫生研究院也是Dataverse的资金支持方之一[34]。
3.3.2 制定政策与协议
除了国家政府部门之外,高校、科研院所及行业协会是数据出版行业标准、规范制定最重要的角色。例如,英国皇家学会(The Royal Society,TRS)颁布《开放数据政策》;国际科学理事会(InternationalCouncil of Science Unions,ICSU)、国际合作伙伴关系(Inter Academy Panel,IAP)、世界科学院(The WorldAcademy of Sciences,TWAS)和国际社会科学理事会(International Social Science Council,ISSC)发布了《大数据世界中的开放数据》协议;英国英格兰高等教育基金委员会(Higher Education Funding Councilfor England,HEFCE)、英国研究理事会(UK ResearchCouncils,RCUK)、威康基金会(Wellcome Trust,WT)和英国大学协会(Universities UK,UUK)四家机构于2016年7月28日发布了共同签署的《开放研究数据协议》[35];英国工程和自然科学研究委员会(Engineeringand Physical Sciences Research Council, EPSRC)在2022年颁布了《EPSRC研究数据政策框架》[36];美国国立卫生研究院在2003年和2023年分别发布了两版《数据管理和共享政策》等[37]。
3.3.3 实现数据资源产出与利用
科研人员是科研数据产出的主体,也是数据出版的主要服务对象。高校、科研院所及行业协会聚集众多科研人员,其在参与数据出版建设的同时也接受着数据出版的服务、享用数据开放的便利进而继续产出更多科研数据,科研人员数据的产出与利用是数据出版价值的直接体现。数据出版秉持FAIR(Findability可查找、Accessibility可访问、Interoperability可互用、Reuse可再利用)原则,出现伊始就是为了使数据被最大化利用,减少科研人员的工作负担,促进科学更高效健康发展,数据资源被有效利用再产出新的科研成果令科研数据出版全过程完成闭环。例如,孙志刚等人[38]于2019年7月在《地球科学数据杂志》(Geoscience Data Journal)发表了一篇生态学的数据论文及数据集,该数据集就是已公开的数据经加工后形成的。
3.3.4 引领完全开放
2023年3月1日,英国皇家天文学会宣布从2024年1月开始,旗下所有期刊都将实现开放获取,包括自1827年出版的第一卷至最新发表的所有文章,读者都可以免费阅读全文。欧洲分子生物学组织(EuropeanMolecular Biology Organization, EMBO)也在同年3月15日宣布,自2024年1月1日起,EMBO Journal和EMBOReports将从鼓励开放出版转变为全面的开放出版。此外,在EMBO出版社期刊上发表的所有研究论文都将包括源数据以及数据可用性部分,并遵循美国国立卫生研究院、白宫科学技术政策办公室(Office ofScience and Technology Policy,OSTP)、欧洲研究委员会(European Research Council,ERC)、地平线欧洲和CoalitionS / PlanS的开放科学政策[39],这些举措在推进完全开放获取中起到了引领作用。
3.3.5 促进方法创新
欧洲分子生物学组织开放科学实施团队尝试将人工智能技术引入开放获取,包括使用人工智能来管理研究论文中的数据集,提高数据发布的效率和可靠性;使用人工智能分析不同期刊、机构和个人所涵盖的研究主题,描绘期刊研究主题的演变,确定出版格局;使用人工智能在同行评审中参与审稿,提取重要主题和受审稿人关注的部分等[40]。由欧盟委员会资助的项目IntelComp将开放的学术数据与人工智能无缝集成,为决策者和科研人员提供人工智能工具来帮助决策和开展科研工作[41]。开放获取研究材料的组织和管理等任务是机器学习算法的应用领地,使用人工智能能补充人类专业知识,提高流程效率,但并不是取代人类输入,而是利用新技术的同时尽量规避其缺陷。
4.数据出版利益相关者多元互动机制
数据出版的利益相关者共同参与到数据出版的过程中,互相之间形成了密不可分的多元互动关系,如图2所示。
图 2 数据出版利益相关者多元互动关系
4.1 发挥数据生产机构的互动保障作用
数据生产机构包括高校、科研院所、行业协会,汇聚众多科研人员,不仅承担科研数据产出的任务,还参与政策制定并提供技术与资金支持。数据生产机构与出版商合作开发数据平台与数据库、提供数据管理服务,积极拥抱新技术赋能数据出版,比如推进人工智能和机器学习算法在审稿和科研流程中的初步应用;共同创建期刊并提供资金支持,促进数据资源的高质量传递。科学支持机构(包括政府部门,行业协会及数据生产机构等)发布的各种技术标准和政策文件帮助科学研究人员、数据出版商、图书馆解决开放数据存储、管理及安全维护问题,为开放数据的使用和共享提供保障。数据生产机构与数据发布机构存在双向关系,数据生产机构为数据发布机构提供内容产出和技术支持,同时也是数据发布机构最重要的用户群体,进而产出更多具有更高使用价值的数据资源。因此,数据出版中各利益相关者多元互动中应协调好数据生产机构与其他机构的利益关系,发挥出数据生产机构在数据产出、标准制定、技术支持等方面的保障作用,促进数据生产机构内部与外部的良好多元互动关系。
4.2 完善数据发布机构的数据整合作用
数据发布机构包括传统期刊、数据期刊、数据发布平台与数据库。期刊走向完全开放在全球开放进程中是不可或缺的一环。传统期刊在开放科学的影响下逐步转向数据期刊,或者通过创建新期刊和自我开放的方式逐步开放,数据出版完整融入传统期刊体系中。为了更好地完善数据发布机构之间的数据整合,为用户提供更便捷的使用体验,传统期刊与数据期刊需要与数据发布平台或数据库建立连接,具体体现在期刊发表论文和数据论文的同时还将数据集放置在数据开放平台上,采用唯一标识符单向或双向链接实现互通,充分整合数据,实现数据发布机构内部的连接与互动。提供数据共享渠道,为科研人员和社会公众提供服务。
4.3 推进社会公众、科研机构等与数据出版商的互动对话
数据出版商承担了宣传推广的大部分工作,向公众、数据发布机构普及数据出版及开放的概念。概念的普及有利于使开放共享成为常态,增强大众对开放数据的了解,利用开放数据实现终身学习,并且社会公众可以作为科学活动的参与者,参与到数据贡献中,辅助科研数据的形成,如访谈的受访者、医学数据的匿名提供者等[42]。但数据出版对传统的数据使用模式产生影响,以数据服务商为主导的传统数据使用模式是由科学研究人员或是科研机构将数据的知识产权转让给数据服务商,由数据服务商通过收取使用费用获得收益,在这过程中利益相关者之间可能会产生一定的利益冲突。在数据出版中需要科学支持机构、科学研究人员、科研机构等与数据出版商搭建沟通的桥梁,在数据版权转让、开放数据使用和版权冲突方面建立多元对话机制,通过对话磋商来解决可能存在的利益冲突,促进各个利益相关者合作共赢。
4.4 发挥政府相关管理部门和行业协会的互动引导作用
政府相关管理部门和行业协会可以在处理开放数据共享中的利益冲突方面发挥作用。科学数据出版的多元互动机制需要以政府相关部门的政策作为利益相关者之间互动的依据和导向,对数据出版与开放共享和使用存在的问题以及利益相关者之间存在的利益冲突应向政府相关管理部门及时反馈。行业协会制定科学数据开放共享行业指南,为数据开放活动提供行动指导。行业协会应与政府相关部门形成良好的合作互动关系,共同制定数据出版的行业指南、出版标准等,为数据出版的规范运作共建良好基础。
5.结语
开放获取在提升全人类科学研究和创新水平上有重要的意义,数据出版也在开放获取领域获得了基本认可。科学数据出版补充了传统科学数据共享体系的短板,传统的“政府主导”方式更多地强调国家财政支持的科研项目产生的科学数据资源共享,数据出版则是以“数据”为核心,更多地保障科研人员的知识产权和成果认可,并在机制、传播周期等多方面具有优势。数据出版与传统的学术出版有很大不同,数据出版作为一种新型的出版模式,对各出版相关机构来说都是一种挑战,各机构需要紧密合作。不同类型、不同层次的资源整合和服务共建,涉及数据出版全流程,构成多类型、层次相互关联的参与者网络,共同推动建立稳定、多边、灵活的合作关系和开放、优质、丰富的数据平台,最终形成各利益相关主体相互影响、具有自我调节和适应能力的科学数据服务生态系统。数据出版相关机构的良好协作和长远眼光是数据出版共享稳定创新发展的关键。发挥所长、弥合短板是协作的目的,我国需要加强机构间协助,促进与国外相关机构合作,提升国际参与度和影响力,关注国际数据组织的动态,积极参与共享实践的开放共享项目。
欢迎扫码查看原文
▌*本文刊自《图书馆研究与工作》2024年第10期,注释和参考文献略。
编辑/邢修远
校对/李萍 郑秀花
审核/屠淑敏
签发/胡海荣
1、推书网发布的文章《唐佳:利益相关者视角下数据出版相关机构的角色和互动机制研究》为推书网注册网友“推书小编”原创或整理,版权归原作者所有,转载请注明出处!
2、推书网文章《唐佳:利益相关者视角下数据出版相关机构的角色和互动机制研究》仅代表作者本人的观点,与本网站立场无关,作者文责自负。
3、推书网一直无私为图书馆转载发布活动及资讯动态。对于不当转载或引用本网内容而引起的民事纷争、行政处理或其他损失,推书网不承担责任。
4、本文转载链接:https://tuibook.com/duihua/43349.html