引言:
科学数据(Scientific Data)是学术工作的支柱和重要产出,也是开放科学运动的重要物质基础。认真负责任地管理和共享科学数据有助于提高研究的透明度、严谨性、可重复性和公共价值。调研高校成熟的科学数据管理实践,进行分析与学习,可帮助我们促进高质量科学数据资源的共享和再利用,推进全球开放科学运动在高校中的实践。今天我们将一起从数据管理政策、数据全生命周期管理、数据素养教育三个维度来了解下帕多瓦大学的科学数据管理现状。
帕多瓦大学图书馆在出版栏目提供开放研究数据板块,提供科学数据管理相关的信息和支持服务。
图 帕多瓦大学开放研究数据支持服务
1.1.1. 数据管理政策
欧盟委员会以及其他资助机构要求获得资助的机构(地平线 2020、地平线欧洲、欧洲研究理事会、地中海科学委员会)将报告研究项目成果的同行评审科学出版物以开放存取的方式提供。它还要求将研究过程中产生的、验证科学出版物中介绍的结果所必需的数据(基础数据)存入研究数据存储库,并以尽可能少的限制提供这些数据。
2018年,帕多瓦大学学术委员会发布了“研究数据管理政策”,承认“研究数据是大学机构的遗产,也是研究、大学教学和社会进步的资源——即使从长远来看也是如此”。
大学的责任:
1) 在软件和硬件方面提供充足的资源、工具和基础设施,以适合数据保存并符合本政策。
2) 协助设计和编制数据管理计划。
3) 开发项目登记服务和机制,以便存放、存储和保存研究数据,并在研究项目期间和结束时保持其可访问性。确保帕多瓦大学的成员能够行使其职责,履行与研究资助者或其他法律实体签订的合同规定的义务。
4) 制作备份副本。
表 帕多瓦大学研究数据管理政策
1.1.2. 数据全生命周期管理
1.1.2.1. 数据管理计划(DMP)
在项目开始之初,甚至在开始创建或收集数据之前,就有必要计划如何管理这些数据:数据将存储在哪里,使用什么软件处理,如何解决任何隐私问题,谁拥有权利,谁可以访问这些数据,以及是否和如何重复使用这些数据:所有这些信息的收集构成了数据管理计划。
欧洲资助计划的指导方针规定,资助金获得者除了提供开放存取文件外,还必须填写一份数据管理计划,并在研究活动开始后的头6个月内提交。
任何妨碍数据或部分数据开放的原因(保密、安全、知识产权等)都必须以书面形式说明。
1) 填写数据管理计划
有许多工具、网站和文件可供研究人员使用,通过核对表创建或验证其 DMP 内容:
a. 帕多瓦大学国际研究办公室:FAIR数据管理计划指南(FAIR data management plan guidelines)
b. 指导编制 DMP:DMPonline
c. 地平线 2020 项目:地平线2020 FAIR数据管理计划(DMP)模板(指南,附件1,第6页)(Horizon 2020 FAIR Data Management Plan (DMP) template)
d. ERC项目:ERC数据管理计划模板(ERC Data Management Plan Template)
e. 数据管理计划核对表(ITA)(Data Management Plan Checklist (ITA) )(大学间研究数据工作组文件,2017 年)
2) 估算管理研究数据的成本
一些资助团体或机构规定,要获得资助资格,数据管理计划除其他事项外,还应报告与管理、共享和再利用项目期间生成的数据有关的成本估算。这些费用应在数据管理计划(DMP)中注明,作为申请资助的组成部分。
为方便研究人员估算研究项目中的数据管理成本,OpenAIRE开发了一个有用的工具:估算成本 RDM 工具(Estimating costs RDM tool)。有关如何估算研究项目中产生或收集的数据的管理成本的详细信息,请参阅 OpenAIRE网站上的特定页面。
1.1.2.2. 数据存储
如果资助机构没有指明用于归档研究数据的数据存储库,则可以使用研究团体最常用的学科存储库或研究人员所属机构的存储库。
帕多瓦大学向教职员工提供 Research Data Unipd 数据库,用于归档和存储研究项目期间生成或收集的数据集。
研究数据 Unipd 符合 FAIR(可查找、可访问、可互操作、可重用)数据档案库的特征,这是欧盟委员会在地平线2020《FAIR数据管理指南(2020)》(Guidelines on FAIR Data Management in Horizon 2020)中提出的要求。
● Phaidra是管理和归档数字藏品的平台,也可在大学使用。
● Unipd 研究数据和 Phaidra 已被最重要的开放存取档案国际注册机构编入索引:re3data.org、OpenDOAR 和 FAIRsharing.org。研究数据 Unipd 是 OpenAIRE 的内容提供商。
● 研究人员还可以将文件和研究数据存入 Zenodo,这是欧洲核子研究中心在欧洲 OpenAIRE 项目背景下建立的跨学科资料库。
1.1.3. 数据素养教育
研究数据是指收集、观察或创建的数据,用于分析和产生研究的原始结果。数据的形式多种多样:测量数据、图像、文本文件、音频文件、程序文件等。
研究数据的管理是一项非常复杂的工作。不过,如果从一开始就正确地进行设置,就能使研究工作和学位论文或博士论文的发表变得更加容易。
大学图书馆系统提供研究和开放获取支持,覆盖开放科学的解释、开放获取的政策法规、OA途径、自存储途径、OA出版、开放研究数据、研究影响力评价、OA出版协议和折扣等方面。
图 帕多瓦大学开放数据及开放获取服务
图 帕多瓦大学学术出版服务