引言:
科学数据(Scientific Data)是学术工作的支柱和重要产出,也是开放科学运动的重要物质基础。认真负责任地管理和共享科学数据有助于提高研究的透明度、严谨性、可重复性和公共价值。调研高校成熟的科学数据管理实践,进行分析与学习,可帮助我们促进高质量科学数据资源的共享和再利用,推进全球开放科学运动在高校中的实践。今天我们将一起从数据管理政策、数据全生命周期管理、数据素养教育三个维度来了解下哥伦比亚大学的科学数据管理现状。
哥伦比亚大学设立了科研与数据诚信(Research and Data Integrity,ReaDI)计划,旨在加强哥伦比亚大学的数据管理和研究完整性。ReaDI计划为各级研究人员提供资源、外联和咨询。
图 哥伦比亚大学研究数据管理
1.1.1. 数据管理政策
表 哥伦比亚大学研究数据管理政策
1.1.2. 数据全生命周期管理
1.1.2.1. 研究与数据诚信 (ReaDI) 计划
科研与数据诚信(Research and Data Integrity,ReaDI)计划旨在加强哥伦比亚大学的数据管理和科研诚信。ReaDI计划为各级研究人员提供资源、外联和咨询。
ReaDI计划不仅仅局限于提供数据生命周期管理服务,而是提供了包括数据管理、数据存储、统计分析、实验设计、研究团队管理等在内的科学研究生命周期内的一系列资源。此外,还针对不同学院和学科提供个性化的资源与服务。
图 哥伦比亚大学研究生命周期服务资源
1.1.2.2. 编写数据管理和共享计划
哥伦比亚提供数据管理计划咨询服务,由研究诚信与合规部助理主任,哥伦比亚大学图书馆的研究数据服务提供支持。
1.1.2.3. 数据共享(科学数据仓储)
一些资助者和出版商要求公开数据。除这些要求外,研究人员可以选择广泛提供全部或部分数据。
如果资助协议要求您共享数据,请访问公共访问授权网页。
哥伦比亚大学《研究数据保存指南(Guidance on Retention of Research Data)》规定,研究负责人(PI)作为大学的保管人,有责任识别、收集、管理和保留研究数据。
有许多方法可以维护和共享您的数据,以便向学术界和更广泛的公众提供。请查看下面的链接和资源,了解有关管理和共享数据的更多信息,并找到适合您和您的研究的存储库。
大学支持的科学数据仓储:以下是可供哥伦比亚大学研究人员选择的数字研究数据存储、共享和传输方案列表。本表由 ReaDI 计划维护。
图 哥伦比亚大学支持的科学数据仓储
LabArchives
哥伦比亚大学为研究人员、教师和学生提供电子研究笔记本(Electronic Research Notebook)(https://labnotebooks.columbia.edu/)服务。这项服务有助于组织和存储实验室数据,提供信息共享,实现协作,所有这些都有自动备份和全面的审计跟踪。
LabArchives提供的这项服务是一个安全的云系统,可在任何地方通过网络浏览器访问。
Secure Data Enclave (SDE)
为哥伦比亚大学的研究人员提供了一个安全、可远程访问的虚拟Windows10桌面环境,用于存储和协作分析PII(个人身份信息)、PHI(个人健康信息)和RHI(受保护的健康信息)数据,以替代传统的物理上安全且受控制的计算环境(“cold room”computing environments)。
1.1.2.4. 数据所有权
研究负责人(PI)负责:
1) 作为大学的保管人,确定、收集、管理和保留研究数据;
2) 确保保存足够的记录,以记录实验方法和数据收集的准确性,以及数据解释的方法和准确性;
3) 采用有序和注明日期的研究数据组织系统;
4) 向其研究团队的所有成员(包括适当的行政人员)传达所选择的数据组织系统;
5) 遵守资助者有关数据访问和保留的要求;以及
6) 遵守大学关于希望商业化的发明或有形研究财产相关数据所有权的规定。
参与大学研究项目的首席研究员以外的个人离开大学时,一般情况下,他/她可以带走他/她参与的任何项目的研究数据副本,但须经首席研究员同意并遵守任何适用的赞助者限制。但是,原始研究数据必须由PI保留在大学。
当首席研究员离开大学,而大学研究项目要转移到另一个机构时,原始研究数据只有在获得以下机构的批准后才能转移:
1) 相关学院、系或中心;
2) PI的新机构,根据大学与该机构之间的书面协议,该协议应保证:(a)该机构接受数据的保管责任;(b)大学可在必要时访问数据;
3) 任何需要事先批准的赞助商。
大学可以以其认为适当的任何理由拒绝允许转让原始研究数据,可以对此类转让施加条件,也可以要求PI将研究数据的副本留给大学。此外,与合作研究项目相关的其他大学研究人员可以在PI获准转让之前复制研究数据,除非受到与研究赞助者签订的适用协议中具体条款的限制。
当大学允许首席研究员携带原始研究数据离开大学时,他/她必须为大学保管研究数据。如果大学提出要求,离任的首席研究员必须将研究数据归还给大学。此外,这些研究数据必须提供给外部资助者、指定的政府官员以及与离职PI合作的其他大学研究人员。
有关访问研究数据的任何争议应首先由适用的系主任或中心主任解决,如果无法解决,则由EVPR解决,如果是在哥伦比亚大学医学中心进行的研究,则由主管研究的高级副院长解决。
数据访问:
大学有权访问所有大学研究产生的研究数据,无论 PI 位于何处。
必要时,为确保适当的访问,大学可以选择实际保管研究数据。
大学希望PI根据资助者有关公众访问研究数据的规定,酌情将研究数据提供给大学内外可能希望使用这些数据的其他研究人员。请访问 "公共访问授权 "网页,了解更多信息。
与合作研究项目相关的其他大学调查员可能需要查看由PI保管的研究数据记录。 在适当的情况下,必须向这些调查人员提供研究数据。 在适当的情况下,必须向研究的外部资助者代表或指定的政府官员提供研究数据。
1.1.2.5. 数据保留
在大学的《研究数据保存指南(Guidance on Retention of Research Data)》中指出,保持原始研究数据的准确和适当记录是任何研究项目的重要组成部分。它是支持和证实研究结果、保护知识产权、促进哥伦比亚大学研究项目管理、实现数据共享以及确保遵守联邦法规、大学政策和资助者要求所必需的。
一般情况下,研究数据应在研究项目结束后保留三年,如果时间更长,则应按照相关赞助方的要求保留,并尽可能保留原始数据。个别学院、系或中心可规定更长的保存期限,但不得缩短。
研究项目最迟应在以下时间结束后视为结束:
1) 向研究赞助者提交最终报告;
2) 赞助研究奖的最终财务结算;
3) 最终发表研究成果;或
4) 学术或研究项目停止,无论其成果是否发表。
(1)大学的责任
大学在保留研究数据方面负有以下一般责任:
1) 遵守有关保留研究数据以支持赠款或合同付款的法规要求;
2) 遵守赞助项目奖励或协议的条款;
3) 保护学生、博士后、员工和其他合作者访问他们参与的研究数据的能力;
4) 确保大学的知识产权;
5) 根据大学政策和/或监管机构或赞助商的要求,封存或以其他方式获取研究数据,用于必要的调查。
(2)PI的责任
PI 在保留研究数据方面负有以下责任:
1) 作为大学的保管人,识别、收集、管理和保留研究数据;
2) 确保保存足够的记录,以记录实验方法和数据收集的准确性,以及数据解释的方法和准确性;
3) 采用有序和注明日期的研究数据组织系统;
4) 向其研究团队的所有成员(包括适当的行政人员)传达所选择的数据组织系统;
5) 遵守赞助商有关数据访问和保留的要求;
6) 遵守大学关于希望商业化的发明或有形研究财产相关数据所有权的规定。
1.1.3. 数据素养教育
1.1.3.1. 数据管理入门:教程和指南
ReaDI计划编写了若干教程,并确定了在研究收集数据阶段协助管理数据的指南。ReaDI计划可提供数据管理咨询和演示,仅限哥伦比亚大学研究人员。
表 数据管理入门教程
1.1.3.2. 数据管理咨询服务
统计分析中心的数据管理服务面向哥伦比亚大学的任何人。他们能够在数据管理的各个方面提供帮助,包括行政系统。他们的服务包括:
1) 病例报告表设计
2) 数据库设计
3) 数据库托管
4) 定制用户界面设计(网页、桌面、电话等)
5) 数据系统设计(分析数据、后勤数据、人事数据、财务数据等)
6) 报告设计
7) 数据库查询和数据集生成
8) RedCap主机和开发
1.1.3.3. 研究数据服务
研究数据服务是哥伦比亚大学图书馆的一部分,可在研究数据生命周期的许多方面提供帮助,包括研究数据管理、查找数据、清理和理解数据的建议、绘制和可视化数据。
1.1.3.4. 欧文临床与转化研究所
欧文临床与转化研究所(Irving Institute for Clinical and Translational Research)提供一小时免费咨询,讨论数据管理要求,帮助设计数据管理计划及相关预算要求,或提供将数据转移到格式正确、安全的环境中的指南。