共计 883 个字符,预计需要花费 3 分钟才能阅读完成。
生成式人工智能的兴起正在悄然改变软件开发领域,特别是对自由开源软件(FOSS)的生存构成了潜在威胁。代码来源、许可和互惠原则正面临着前所未有的挑战。
现代社会高度依赖软件,而这些软件大多建立在自由开源软件(FOSS)之上。FOSS 是由协作社区共同构建的代码库,开发者在使用这些代码的同时,也会积极贡献错误修复和改进。
然而,生成式人工智能的出现正在改变这一生态。每一行代码都应能追溯到其原创者,这一 FOSS 的核心属性通常由“Copyleft”许可证管理。Copyleft 与版权相反,它要求修改后的代码必须在与原始代码相同的条款下共享。但生成式人工智能可能会将专有或 Copyleft 代码片段混入其输出中,导致开发者无法有效审核或正确授权。
耶鲁大学隐私实验室创始人 Sean O’Brien 指出,生成式人工智能的基础设施正是由它现在所消耗的公共资源构建的。自由开源软件构建了互联网,从运行服务器的 Linux 内核到支持网络的 Apache 和 Nginx,再到管理数据的 PostgreSQL 和 MySQL,以及推动机器学习革命的 Python、GCC 和 TensorFlow。每个云提供商、每个超大规模数据中心、每个 LLM 管道都建立在 FOSS 之上。
O’Brien 称这种现象为“许可证失忆”。他表示:“代码脱离了其社会契约,开发者无法回馈,因为他们不知道将贡献发送到哪里。”这种现象不仅威胁到 GNU GPL 等互惠或 Copyleft 许可证的法律结构,还可能使下一代开发者继承一个代码私有化、历史被掩盖、互联网本身成为另一个由 LLM 驱动的聊天机器人标记为公共领域的封闭平台的世界。
O’Brien 强调:“公共资源从来不只是关于免费代码,而是关于共同构建的自由。”这种自由,以及支撑几乎所有现代社会的基础设施,正面临风险,因为当人工智能吸收互联网上的一切并对其进行‘洗白’时,归属权、所有权和互惠原则变得模糊。
如果我们不认识到 FOSS 不仅仅是一种许可制度,而是公民基础设施,那么未来的开发者将面临一个代码私有化、历史被掩盖的世界。生成式人工智能的兴起,不仅是对开源软件的挑战,更是对整个互联网生态的考验。