什么是FAIR原则呢?
FAIR原则指科学数据的
可发现(Findable)
可访问(Accessible)
可互操作(Interoperable)
可重用(Reusable)
的管理原则
FAIR原则的起源
2014年1月,一些代表学术界、工业界、资助机构和学术出版商的多元化利益相关者齐聚荷兰莱顿,举办了一场以“Jointly Designing a Data FAIRport”为主题的研讨会。与会专家共同研讨起草了一份指导科学数据管理的倡议性文件,倡导科研活动产出的数据在开放共享过程中应该努力实现可发现(Findable)、可访问(Accessible)、可互操作(Interoperable)和可重用(Reusable),4个目标层层递进,简称为“FAIR原则”。
2016年,FORCE11(一个由学者、图书馆员、档案管理员、出版商和研究资助者组成的社区,旨在有效利用信息技术来改变现代学术交流)对FAIR原则进一步优化,并将4个抽象目标细化为15条具体原则正式发布。
可发现(Findable)
科学数据共享的首要前提是数据能够被用户及时发现,所以可发现原则是数据FAIR化的基础。
可发现原则的总体要求是数据及其相关补充材料使用全球唯一、可解析、永久存在的标识符进行标记,且应该具有足够丰富的元数据描述。
F1:(元)数据被分配一个全球唯一且永久的标识符。
F2:数据被丰富的元数据所描述。
F3:元数据中清楚明确地包括它描述的数据的标识符。
F4:(元)数据在可搜索的资源中可以被注册或索引。
可访问(Accessible)
数据一旦被识别和发现,就应该通过受信任的存储库提供的服务来访问数据,但必须有明确规定检索数据资源的相关协议,使用户知晓如何访问数据、如何进行身份验证、如何获得访问权限等。
可访问原则的总体要求是(元)数据不仅能被人类访问,而且能被机器尤其是计算机等在遵循一定访问协议且有明确定义的授权或认证规则的前提下无障碍访问。
A1:(元)数据可以通过标准化通信协议规定的标识符来检索。
A1.1:该通信协议是开放、免费且可以普遍实现的。
A1.2:该通信协议允许在必要时进行认证和授权程序。
A2:即使数据不再可用,元数据仍然可以被访问。
可互操作(Interoperable)
可互操作原则的总体要求是使用标准定义和通用的数据元素来表示数据并实现互操作。人类和机器都应该能够交换和解释彼此拥有的数据,互操作意味着某一系统至少与另一系统的数据格式相通用,无需使用专有的算法即可实现数据被机器可读。
I1:(元)数据使用正式、可获取、共享和广泛适用的语言来表示知识
I2:(元)数据在遵循FAIR原则的前提下使用词汇表
I3:(元)数据中应该包括对其他(元)数据的限定引用
可重用(Reusable)
数据可发现、可访问、可互操作的最终目的是实现数据资源广泛重用。
可重用原则的总体要求是数据和数据集具有明确的使用许可,并提供数据源头的准确信息 。
R1:(元)数据被具有多个准确且相关的属性所丰富地描述。
R1.1:(元)数据将以清晰且可访问的数据使用许可来发布。
R1.2:(元)数据与详细的出处相关联。
R1.3:(元)数据符合相关领域的社区标准。
参考文献:
[1] 宋佳,温亮明,李洋. 科学数据共享FAIR原则:背景、内容及实践[J]. 情报资料工作,2021,42(1):57-68. DOI:10.12154/j.qbzlgz.2021.01.007.
[2] Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3:160018 doi: 10.1038/sdata.2016.18 (2016).
[3] https://force11.org/info/about-force11/