生成式AI威胁开源软件？代码互惠原则面临挑战

64次阅读

共计 883 个字符，预计需要花费 3 分钟才能阅读完成。

生成式人工智能的兴起正在悄然改变软件开发领域，特别是对自由开源软件（FOSS）的生存构成了潜在威胁。代码来源、许可和互惠原则正面临着前所未有的挑战。

现代社会高度依赖软件，而这些软件大多建立在自由开源软件（FOSS）之上。FOSS 是由协作社区共同构建的代码库，开发者在使用这些代码的同时，也会积极贡献错误修复和改进。

生成式 AI 威胁开源软件？代码互惠原则面临挑战

然而，生成式人工智能的出现正在改变这一生态。每一行代码都应能追溯到其原创者，这一 FOSS 的核心属性通常由“Copyleft”许可证管理。Copyleft 与版权相反，它要求修改后的代码必须在与原始代码相同的条款下共享。但生成式人工智能可能会将专有或 Copyleft 代码片段混入其输出中，导致开发者无法有效审核或正确授权。

耶鲁大学隐私实验室创始人 Sean O’Brien 指出，生成式人工智能的基础设施正是由它现在所消耗的公共资源构建的。自由开源软件构建了互联网，从运行服务器的 Linux 内核到支持网络的 Apache 和 Nginx，再到管理数据的 PostgreSQL 和 MySQL，以及推动机器学习革命的 Python、GCC 和 TensorFlow。每个云提供商、每个超大规模数据中心、每个 LLM 管道都建立在 FOSS 之上。

O’Brien 称这种现象为“许可证失忆”。他表示：“代码脱离了其社会契约，开发者无法回馈，因为他们不知道将贡献发送到哪里。”这种现象不仅威胁到 GNU GPL 等互惠或 Copyleft 许可证的法律结构，还可能使下一代开发者继承一个代码私有化、历史被掩盖、互联网本身成为另一个由 LLM 驱动的聊天机器人标记为公共领域的封闭平台的世界。

O’Brien 强调：“公共资源从来不只是关于免费代码，而是关于共同构建的自由。”这种自由，以及支撑几乎所有现代社会的基础设施，正面临风险，因为当人工智能吸收互联网上的一切并对其进行‘洗白’时，归属权、所有权和互惠原则变得模糊。

如果我们不认识到 FOSS 不仅仅是一种许可制度，而是公民基础设施，那么未来的开发者将面临一个代码私有化、历史被掩盖的世界。生成式人工智能的兴起，不仅是对开源软件的挑战，更是对整个互联网生态的考验。

正文完