一、中国开放科学实践
2025年全国两会期间,全国政协委员、中国图书进出口(集团)有限公司总经理林丽颖表示,开放科学是科研范式的革新,也是科技竞争中的系统性工程。在推动开放科学发展过程中,为推动落实联合国教科文组织《开放科学建议书》,推动中国积极融入全球开放科学实践,2022年中国科协倡议成立“开放科学促进联合体”。作为“开放科学促进联合体”成员单位,2024年中国图书进出口(集团)公司联合清华大学图书馆和中国高校科技期刊研究会,共同推出了“国际开放获取期刊推荐名录(International OA Journal Recommended List,OARL)”,为科研人员提供甄别高质量开放获取期刊的参考和指引。
近年来,我国在推进开放科学方面取得了相当成就,无论是在政策制定、开放获取的规模,还是在数据共享、国际合作以及基础设施建设上。“以国产AI大模型DeepSeek为例,其采取的开源技术路线,正是我国为全球贡献的‘智慧之力’”。
更多关于OARL信息,见往期推文“国际开放获取期刊推荐名录(OARL)发布”。
原文链接:
新华网.吴艳(责任编辑).全国政协委员林丽颖:开放科学进入新发展阶段.(2025-03-11)[2025-04-08].https://www.news.cn/science/20250311/44b480c50f83471c9224676261d1a8e7/c.html
二、大语言模型开源动向
2025年1月20日,杭州深度求索人工智能基础技术研究有限公司以MIT开源协议发布DeepSeek-R1系列模型,允许商业使用与二次开发,延续计算机科学的开放传统。3月24日,DeepSeek V3发布版本更新V3-0324,同样采用MIT开源协议。
近期开源的其他大语言模型(LLMs)还有:
2025年3月,阿里巴巴通义千问团队以Apache 2.0开源协议发布端到端多模态大模型Qwen2.5-Omni。该模型具备处理文本、图像、音频和视频等多种输入的能力,并能实时生成文本和自然语音响应。
2025年1月,英国Atla公司以Apache 2.0开源协议发布Selene Mini,允许开发者自由地使用、修改和分发代码。这是一款先进的小型语言模型评估器(Small Language Model-as-a-Judge,SLMJ)旨在作为通用评估器,对语言模型的输出进行准确、公正的评估。
2024年12月,中国人民大学高瓴人工智能学院以MIT开源协议发布YuLan-Mini。这是一款轻量级语言模型,它在数学和代码领域表现出色。
2024年12月,微软公司以MIT开源协议发布Phi-4。这是一款拥有140亿参数的开源语言模型,专注于提升复杂推理能力。
相关链接:
https://github.com/eugeneyan/open-llms
https://huggingface.co/models
三、高校开放科学实践
自动化采集全文与元数据:牛津大学机构知识库(ORA)的开放获取实践探索
2025年2月,牛津大学博德利图书馆的开放获取服务开发负责人Jason Partridge发表案例研究成果。文章指出,随着各类开放获取(OA)政策的推进——特别是来自研究资助机构及英国“研究卓越框架”(REF)的合规要求——研究人员和图书馆支撑团队面临着日益繁重的行政事务。如何在遵守相关OA政策的同时,减轻学术人员的非科研负担,成为实践中的一大挑战。文章介绍了牛津大学的OA演进趋势,尤其是向金色开放获取(Gold OA)模式的持续转型,以及引入自动化系统以减轻行政负担的尝试。文章采用知识共享署名(CC BY)许可发表。
更多关于牛津大学的OA政策,见往期推文:
高校开放获取政策:牛津大学篇
牛津大学更新开放获取政策
原文链接:
https://insights.uksg.org/articles/10.1629/uksg.685
四、开放科学基础设施
欧洲学术知识库的未来:基于社区咨询的洞察与行动倡议
2025年4月7日,OpenAIRE网站发布文章指出,开放科学正在重塑全球科研格局,欧洲知识库(仓储)在这一进程中发挥着至关重要的作用。为回应这一趋势,OpenAIRE、COAR、LIBER和SPARC Europe于2024年联合开展社区咨询,形成了“IMPACT-REPO行动计划”,明确了知识库在扩大科研成果的影响力(Impact)、提升知识获取的公平性与包容性(Inclusiveness)、增强研究数据长期保存的可信性(Trust),以及推动人工智能时代的可持续创新(Innovation)四个关键领域的价值。
为确保知识库在数字科研生态中持续发挥关键作用,行动计划提出了多项优先行动建议,包括:
增强机构投入:保障知识库的长期资金与专业队伍配置;
确保互操作性:确保知识库与科研基础设施的互操作性;
对齐机构政策:将知识库纳入机构的开放科学政策体系;
适应AI时代:提供机器可读的元数据和关联数据;
强化网络协作:推动国家与国际层面的知识库网络;
建设人才体系:提升从业者的数字内容管理与AI应用能力;
保护研究完整性:实施数字保存措施,保护研究完整性。
原文链接:
https://www.openaire.eu/the-future-of-european-repositories-insights-from-a-community-consultation