在日常讨论中,开放科学常被描述为一种“更公平”“更高效”的科研范式。然而,仅强调理念远远不够,我们必须审视其在实际推进过程中所面临的结构性挑战。回溯20世纪下半叶,商业学术出版商(如爱思唯尔、施普林格、威立、泰勒弗朗西斯)逐步削弱非营利性学术出版结构,将“工业化”方法引入学术出版生态,深刻影响了知识生产与流通的机制。进一步地,互联网的发展不仅将学术交流的范畴从单一的学术出版物扩展到数据、软件等多种产出,同时也催生了关于开放科学实施路径的经济性问题:
一、经济模型
1 学术社群主导的“俱乐部模型”
在较长时间里,学会期刊、学科社群主导的学术出版形式占据主导地位。出版目标围绕学术共同体的声誉与交流,而非利润最大化。这种“知识俱乐部”(Knowledge Club)型结构具有以下特点:
自1665年伦敦和巴黎创办首批科技期刊以来,作者从不因发表文章而获得稿酬,学术认可和职业晋升是主要激励;
成本较低,依靠学者社群的志愿劳动维护质量与规范;
治理机制由学术群体内部产生,决策更贴近学科需求;
成员资格通过文化规范而非正式程序确立(需要投入时间证明对共同价值的认同);
在数字化基础设施建设、规模扩展、长期存储等方面资源有限。
20世纪下半叶,小型学会出版社逐渐被大型商业出版集团收购或挤出市场。但在1990年代初,随着互联网和开放期刊系统(Open Journal System)等免费编辑工具的出现,俱乐部模型获得了新的生命力。《Postmodern Cultures》《Surfaces》等由学者和图书馆员而非出版专业人士管理的期刊开创了网络开放出版的先河。在开放科学浪潮中,这类社群型期刊一方面拥抱开放获取(如英国皇家学会自2014年起发行《皇家学会开放科学》期刊),另一方面也面临资金不足、技术升级压力等现实制约。
2 商业出版主导的“市场模型”
—从封闭订阅到垂直整合—
1959年,Robert Maxwell创立佩加蒙(Pergamon)出版社,通过收购数百种小型大学出版社和学会期刊,开创了学术出版的工业化模式。虽然单个期刊利润有限,但高度集中使Pergamon变为“大到不能倒的规模(Too big to fail)”。这种规模优势使其能够向图书馆和其他潜在客户强加自己的条件。Springer和Elsevier随后采用了类似策略。学术出版被描述为具有显著“网络外部性”(#网络效应#需求方规模经济)的双边市场:作者偏好在读者最多的期刊发表,读者偏好作者最优秀的期刊。由于学术出版市场高度集中,学术期刊具有不可替代性(Not subtractable),这严重阻碍了竞争的形成;而文献计量指标的发展则强化了这一锁定过程(Locked-in process)。
—大额交易与混合市场—
随着电子期刊的普及,领先的出版商推出了“大额交易”(Big Deal)策略——将数千种期刊打包成多年期许可协议,通常与国家图书馆网络和学术机构谈判。Big Deal对出版商非常有利,因为它在降低管理成本的同时,确保了协议中所有期刊的整体的商业可行性。
Big Deal许可通常受保密协议约束,使出版商能够根据机构支付意愿定价,这偏离了正常的市场规范:退出Big Deal对主要科研机构来说几乎是不可能的选择。
—从出版到数据分析:业务多元化—
2010年代后,领先的出版商将业务从内容提供转向数据分析。Elsevier、Taylor & Francis和Wiley在过去二十年完成了数百起并购,从学术内容扩展到"服务"和数据分析工具。
到2019年,Elsevier已建立覆盖科研全流程的平台组合:最大的学术期刊供应商同时负责评估和验证研究的质量与影响力(如Pure、Plum Analytics、SciVal)、管理用于协作的研究网络平台(如SSRN、Hivebench、Mendeley)、管理用于寻找研究资金的工具(如Plum X、Mendeley、Sci Val),以及控制用于分析和存储研究人员数据的平台(如Hivebench、Mendeley Data)。
学术出版巨头利用垂直整合策略,将自身服务深度嵌入科研工作流程,形成了超越传统订阅模式的用户锁定与依赖。数据指标与算法推荐可能构成寻租活动(Rent-Seeking),它们甚至能与资助方的开放获取政策目标“相辅相成”,因为追踪政策合规性催生了对这些数据分析工具的新需求。这种模式体现了平台资本主义(Platform capitalism)的特征:内容访问的自由获取是以研究者的数据被提取和行为被监控为代价的,是一种隐性的“数据付费”模式。
这种模型的优势在于:
但同时也带来一系列争议:
高昂的订阅费用和封闭访问加剧了知识不平等;
从传统订阅模式向APC(论文处理费)模式转型后,经济负担转移到作者或其机构,弱势群体面临新的发表门槛;
市场高度集中,议价权向少数大型出版集团集中;
“双重收费”问题:混合期刊模式下,出版商同时收取订阅费和APC;
私有化基础设施控制了研究生命周期的所有环节,引发对学术自主性的担忧。
3 知识公地与开放基础设施的“公共共享模型”
最具有变革潜力的是将科学成果视为“共享资源”的公共型模型。与共享自然资源类似,开放科学的产出可能被污染、耗尽或封闭。因此,开放科学更适合用“知识公地”(Knowledge Commons)框架理解——需要社群共同管理和治理规则,以防止“公地悲剧”。
开放期刊、开放数据仓储、开放软件社区、预印本平台以及各类开放基础设施,一起构成了所谓的“开放科学公地”(Open Science Commons)。
在这一模型中,知识不再通过强排他性的产权和访问控制来获取收益,而是通过公共资助、机构共同出资、学科社群自组织以及少量合理的服务收费等方式来维持。
1991年8月,Paul Ginsparg在洛斯阿拉莫斯国家实验室创建了arXiv的前身。其初衷是为了解决日益增长的科学文章共享导致学术邮箱存储空间不足的问题。作为最早的开放科学基础设施之一,arXiv体现了Ostrom定义下的公共资源特征:维护和保护科研资源,对成员资格实施较低的要求(提交的论文无需同行评审),并且将协调和共享管理置于竞争之上。到21世纪初,许多仓储努力遵守1999年开放档案倡议元数据获取协议(OAI-PMH),该协议确保了不同仓储间的互操作性。
这类模式凸显了公共利益,但也把一个关键问题摆在台面上:在缺乏明确盈利机制的前提下,如何保证这些基础设施的长期稳定运行和治理?
2015年,由几位学者发布的《开放学术基础设施原则》(POSI)强调了科研出版物和数据集日益开放与控制其流通的基础设施封闭之间的差距:“学术社群并不拥有或控制大部分此类信息。例如,我们本可以建立或承担收集书目数据和引文的基础设施,但这项任务却留给了私营企业。”2025年10月,由开放学术基础设施采纳者群体主导修订的POSI 2.0发布,聚焦于开放基础设施的财务可持续、运营透明性和系统弹性。
开放基础设施倾向于非营利、公共资助模式,学术社群深度参与,使其与私有封闭基础设施有所区别:“开放基础设施通常由学者主导、非营利组织运营,因而以使命而非利润为驱动。”这一地位旨在确保基础设施的自主性,防止其被纳入商业基础设施。
截至2025年,正式采纳POSI的主要组织或倡议包括Crossref、DataCite、CORE、COUNTER、OpenAIRE、OpenCitations、DOAJ、Dryad、Europe PMC等。
二、开放科学的成本与收益
1 成本结构的重构
开放科学并没有消除成本,只是改变了成本结构与承担方式。
—降低的成本:排他性成本—
传统封闭出版模式中存在大量“排他性成本”:订阅谈判、权限控制、版权管理、访问认证等环节都需要资源投入,开放获取在一定程度上削减了这些成本。
—持续存在的核心成本—
开放模式必须承担一系列不可忽视的“基础设施成本”:
可以说,开放并不等于“零成本”,而是将资金从封闭访问的费用转移到开放平台的建设和维护上,同时通过规模经济、开源工具和社群志愿劳动显著降低了整体成本。
2 效率与社会效益的提升
从收益角度看,开放科学的潜在效应非常显著:
访问障碍降低后,研究者和相关实践者能够更快速、广泛地获取文献和数据,节省大量“寻找与获取”的隐性成本;
数据和软件的开放复用减少了重复劳动,使协作研究更为顺畅,科研整体效率提高;
消除版权壁垒、促进文本和数据挖掘是提高研究效率和释放巨大创新潜力的关键所在;
开放成果更易被教育、产业、公共部门采纳和转化,产生更广泛的创新与社会效益。
一些大型开放科学项目的经验表明,将核心数据和成果完全开放之后,往往能激发大量意料之外的应用场景,带来远超项目本身的经济与社会回报。当然,这类效益的具体量化仍面临很大困难。
开放科学的经济模型重构了成本与收益的分配逻辑,但这一转型并非一帆风顺。在下一篇文章中,将深入探讨开放科学面临的经济风险、不平等问题,以及政策与制度如何为可持续的公地治理提供解决方案。
本文编译自法国开放科学委员会发布的《开放科学小百科》。该项目聚焦开放科学十个核心议题,内容基于权威学术资料,按知识共享-署名(CC-BY)许可协议开放。
原文链接:https://encyclo.ouvrirlascience.fr/