引言:
科学数据(Scientific Data)是学术工作的支柱和重要产出,也是开放科学运动的重要物质基础。认真负责任地管理和共享科学数据有助于提高研究的透明度、严谨性、可重复性和公共价值。调研高校成熟的科学数据管理实践,进行分析与学习,可帮助我们促进高质量科学数据资源的共享和再利用,推进全球开放科学运动在高校中的实践。今天我们将一起从数据管理政策、数据全生命周期管理、数据素养教育三个维度来了解下哈佛大学的科学数据管理现状。
1.1.1. 数据管理政策
1.1.1.1. 愿景
研究数据是我们大学和研究人员的重要资产。因此,我们希望支持稳健的数据管理和记录实践,确保哈佛大学研究数据的长期访问和重复使用。
正因如此,我们发起了一项新倡议,旨在协调哈佛大学的所有研究数据管理工作,找到我们可以跨学院合作的领域,然后改进我们对所有哈佛研究人员的研究数据管理的支持。这包括将有用的数据引入哈佛,供内部研究使用,将哈佛研究人员的数据提供给其他人使用,提供适当的资源和工具以支持数据生命周期,鼓励在使用数据时采用最佳做法,并确保遵守内部和外部的数据政策和法规。
我们计划通过以下措施来实现这一目标:
1)成立一个研究数据管理教师咨询委员会,该委员会代表了不同的研究领域、方法和数据类型;
2)成立几个由来自不同学院的工作人员组成的工作小组,每个小组专注于改进研究数据管理的一个特定方面(如数据使用协议、数据整理、最佳实践培训、数据管理和分析工具);
3)与研究副教务长办公室、哈佛图书馆和哈佛大学信息技术部门合作,提供所需的服务。
我们的目标之一是与国家和国际研究数据工作以及联邦机构、慈善组织、期刊和出版商保持一致,使研究数据成为 FAIR(可查找、可访问、可互操作和可重用)数据,并尽可能开放,同时根据需要加以保护。此外,为了支持哈佛自身的研究发展,我们的目标是提供更多和更高质量的数据,这些数据管理完善,易于在研究小组内部和跨研究小组使用。
1.1.1.2. 相关政策
有许多政策和法规可能会影响哈佛大学研究人员的数据工作。在网站列出了比较常见的内部法规和联邦层面、州层面及国际层面的外部法规。哈佛大学内部的政策法规如所示。
表 哈佛大学科学数据管理政策
1.1.2. 数据全生命周期管理
提供科学数据全生命周期管理服务和相关支持,从数据管理计划、数据获取和收集、数据安全存储和分析,到数据的传播和保存。
图 哈佛大学科学数据全生命周期管理服务
1.1.2.1. 数据订阅
哈佛大学是否订阅了我可以用于研究的数据源?
如果您的研究需要访问您未制作的数据,哈佛图书馆馆藏有大量数据集,图书馆员也可以帮助您从图书馆馆藏或公共资源中查找数据。
您可以浏览在线指南,或通过哈佛图书馆的研究帮助服务向专业图书管理员咨询。
在Hollis或Harvard Subscription Data Dataverse中搜索,在图书馆的TDM @ Harvard page页面查找文本和数据挖掘资源。
1.1.2.2. 开放获取
哈佛大学有一个开放获取资料库 DASH(Digital Access to Scholarship at Harvard),欢迎所有哈佛附属机构的学术成果。哈佛设有一项基金,为选择在基于文章处理费(APC)的开放获取期刊上发表文章的哈佛学者支付APC。哈佛大学的所有学院都制定了开放式获取政策,这些政策是在2008年至2014年间由教职员投票通过的。事实上,哈佛是美国第一所采用OA政策的大学。它也是世界上第一所通过教师投票而非行政命令通过OA政策的大学,还是世界上第一所保留授权OA所需权利的大学。最近,哈佛大学通过了一项自愿性的个人OA许可,让非教职员工也能享受到校级政策赋予教职员工的权利。所有这些举措都由学术交流办公室(OSC)负责协调。
1.1.2.3. 科学数据仓储(SDR)
(1)Harvard Dataverse
1) 用于共享、引用和保存所有领域的研究数据
2) 哈佛大学研究人员可免费使用;使用HarvardKey保存数据
3) 哈佛商学院教师可获得将数据存入哈佛商学院Dataverse的服务
(2)Vivli
哈佛大学是Vivli的创始成员。Vivli是一个非营利组织,其使命是促进临床试验数据的共享。Vivli包括一个独立的数据存储库、基于云的分析平台和深度搜索引擎,学术界、工业界、基金会和非营利实体的研究人员通过它可以托管、共享和访问临床试验数据。
1.1.3. 数据素养教育
哈佛大学提供一系列与研究数据管理相关的服务和支持,主要涵盖了哈佛大学及其各个学院和图书馆的不同计划和资源。以下是各项计划的简要总结:
1) 贝克研究数据计划:面向商学院,提供研究数据管理服务和支持。
2) 生物医学研究数据管理最佳实践:提供专门针对生物医学数据管理的培训,旨在推广最佳实践。
3) 哈佛大学教育研究生院研究数据管理:提供与哈佛教育研究生院研究流程相关的资源,包括审批流程、研究安全、限制使用数据、安全数据室和高级统计实验室。
4) 哈佛图书馆研究数据管理计划:提供服务,帮助所有哈佛研究人员进行研究数据管理,包括数据管理计划和使用工具如DMPTool以及数据保存。
5) 哈佛研究计算培训:由RC提供各种培训,包括相关培训和材料,支持研究计算的需求。
6) 哈佛培训门户网站:提供有关研究数据管理的其他培训,为研究人员提供更多学习资源。
7) HMS生物医学数据管理:提供与生物医学数据研究数据管理相关的服务、支持和培训,面向医学院、牙医学院和陈子昂公共卫生学院。
8) 沃尔巴赫图书馆-数据归档与共享:为哈佛大学天体物理学中心和史密森尼学会的研究人员提供研究数据管理方面的服务和支持,重点是数据的归档与共享。