用 Claude Code、Cursor、Codex 这类工具写代码已经成了很多人的日常。但有一个问题很少被认真对待:这些代码的版权,到底归谁?
答案比大多数人以为的更麻烦。它可能根本不受版权保护,可能已经属于你的雇主,也可能已经被你看不见的开源许可证悄悄污染。
这篇文章梳理目前的法律现状,明确哪些已有定论、哪些仍在争议,以及作为开发者应该做的几件实际的事。
一个没人告诉你的版权基本规则
先把法律基线说清楚:版权只保护人类创作的作品。
美国版权局一再重申这一立场,DC 巡回法院在 Thaler 案中也维持了这个判决。2026 年 3 月最高法院拒绝受理 Thaler 上诉,并不意味着认可下级法院的推理,只是意味着法院选择不审理该案。但结果是:DC 巡回法院的裁决依然有效,版权局的立场依然稳固,目前没有任何法院站在对立面。
实际含义:没有实质性人类参与而主要由 AI 生成的作品,在当前法律框架下不具备版权保护资格。如果竞争对手复制了这段代码,你可能没有任何法律救济手段,因为它实际上处于公共领域。
Thaler 案的两个重要边界
Thaler 案有两点需要特别注意,不要过度解读:
-
这个案子涉及的是完全没有人类参与的绘画,原告明确将 AI 系统列为唯一作者。裁决并不直接回答"有人类参与但程度存在争议"这种更常见的情况。
-
案子涉及的是视觉艺术作品。目前还没有法院将人类作者原则直接适用于 AI 编程工具的代码输出。逻辑上适用,但直接先例还不存在。
什么叫"实质性人类创作"
决定你的代码是否受保护的关键词是"实质性人类创作(meaningful human authorship)"。版权局刻意拒绝用百分比或编辑次数来量化它,因为法院真正看的是人类是否做出了真正的创意决策:
- 选择了整体架构
- 决定拒绝哪些 AI 输出
- 将生成结果重构以适配具体设计
向模型描述一个目标并不够。指导作品如何构建才算数。
在 Agentic 工作流中,这个区分比听起来更难建立。设想一个典型的 Claude Code 使用场景:
- 你写了一行 prompt:“为 API 构建一个限流模块”
- Claude Code 规划方案、生成五个文件、迭代三个版本
- 你审查输出、跑通测试、合并代码
这个流程里,你的贡献是架构意图和最终审批。这是否构成法庭认可的"实质性人类创作",目前没有明确答案。
诚实的估计是:对你大幅调整过的模块,大概是受保护的;对你原样接受的代码,大概不是;中间那片灰色地带,没人知道。
正在审理的案子
这个灰色地带目前正在诉讼中。在 Allen v. Perlmutter 案中,艺术家 Jason Allen 用超过 600 条详细 prompt 加上 Photoshop 后期编辑,正在挑战版权局拒绝注册的决定。版权局承认 Photoshop 部分属于人类创作,但仍拒绝为 AI 生成的底层内容注册。这个案子还未判决,但结果将是迄今最接近"参与程度多少才够"这一问题的裁判。
目前最接近的先例是 Zarya of the Dawn——一本图文小说,版权局为人类创作的文字授予了注册,但拒绝了 Midjourney 生成的图像。这为开发者提供了一个实用原则:AI 辅助代码库中人类创作的部分可以单独受保护,即使生成的代码本身不受保护。
你的架构文档、提交信息里的设计决策、ADR、展示刻意调整过程的 prompt 记录——这些可能作为人类创作的表达受到保护,即便它们指导生成的代码不受保护。
雇主可能已经拥有这些代码
在讨论代码是否受版权保护之前,有一个更直接的问题:就算受保护,这真的是你的吗?
你的劳动合同几乎肯定写明,任何在工作中构建的东西都属于雇主。这在版权法里叫职务作品原则(work-for-hire doctrine):雇员在职务范围内创作的代码,归雇主所有,雇主被视为法律上的作者——无论代码是手写的、由 Claude Code 生成的,还是两者结合。使用 AI 编程工具不会改变谁拥有结果。
大多数劳动合同的约定比这个原则的默认范围更宽。打开合同,搜索"知识产权"、“IP 转让"或"工作成果”,仔细读那一节。如果包含以下任何表述,你用 AI 辅助写的代码几乎肯定也在其中:
- “使用公司设备或资源创建的任何工作成果”
- “在雇佣期间产生的任何发明或开发”
- “使用公司授权工具协助创建的任何软件”
第三条最值得关注。 如果你的雇主为团队购买了 Claude Code、Cursor 或 Copilot 的许可,而你用同一套工具做副业项目,宽泛的 IP 转让条款可能让雇主对那个副业项目也产生主张——即便你是在自己的时间里做的。
这不是假设。有人碰到过这种情况:一位旧金山的高级开发者,用 Claude Code 做工作项目,也用它做下班后的健身 App。公司更新了 IP 政策,主张他用 AI 辅助构建的所有东西都属于公司——理由是 Claude 在 IDE 里能"看到"公司的工作文件,因此任何 AI 输出都是公司 IP 的衍生作品。
从法律角度,这个主张站不住脚——IDE 上下文可见性并不会让 AI 输出成为附近打开文件的衍生作品。但它说明雇主已经开始提出这类主张。
实际规则:做副业的话,用个人账号、个人设备、自己付费的工具。把雇主的授权工具完全排除在那个工作流之外。
你可能已经引入了看不见的开源许可证
就算你确实拥有这些代码,它可能已经被你不知道的开源许可证污染了。
AI 编程工具训练于海量公开代码,其中包括 GPL、LGPL 等 Copyleft 许可证下的代码。Copyleft 许可证有一个随代码传播的义务:
- 如果你分发的软件是 GPL 代码的衍生作品,必须在相同许可证下开放源代码
- 即使你不知道引入的代码是 GPL 授权的,也适用
- “我不知道"不是 Copyleft 违规的抗辩理由
当 AI 工具从训练数据中重现了一段 GPL 代码的实质性逐字内容,而你把这段代码放进了商业产品又没有开放源代码,可能就构成了 Copyleft 违规——你甚至从未接触过原始代码仓库。
法律标准是实质性逐字复现(substantial verbatim reproduction),而不是功能相似或风格相近。AI 生成的代码"功能上像"某个 GPL 库,和 AI 逐字复现了那个 GPL 库,在法律上是两件事。风险集中在逐字那一端,问题在于你无法在不做扫描的情况下知道自己的代码库落在哪一侧。
chardet 社区争议
2026 年初的 chardet 社区争议让这个问题变得具体。一位开发者用 Claude 重写了 chardet(一个 Python 字符编码检测库),并以 MIT 许可证重新发布,声称 AI 重写是"洁净室实现”,不受原始 LGPL 许可证约束。
社区争议的核心法律问题:如果 Claude 在 LGPL 授权代码库上训练过,而输出复现了那个代码库的实质性逐字内容,输出是否可以被视为无许可证约束?
这个争议没有清晰的结局,也没有法院对这个具体问题做出权威裁决。目前已确定的是:无论通过什么方式产生,逐字复制 GPL 代码都违反许可证。尚未确定的是:AI 生成的输出如果复现了训练数据的模式,是否算作逐字复制。在 M&A 并购尽调中为公司提供建议的律师,普遍的工作假设是"可能算"——这个假设现在已经成为收购尽调的标准条件之一。
Doe v. GitHub 诉讼
截至 2026 年 4 月,Doe v. GitHub 案仍在美国第九巡回法院审理中,追问 GitHub Copilot 是否在未注明出处的情况下复现了受许可证保护的代码,违反了版权法和 DMCA 第 1202 条。地区法院驳回了大部分诉讼请求,但上诉仍在进行。
无论结果如何,这场诉讼已经改变了行业行为:GitHub Copilot 增加了重复代码检测过滤器,收购尽调现在也常规包含 AI 代码库许可证扫描。
实际应该做的四件事
1. 对 AI 辅助代码库跑一次许可证扫描
推荐工具:
- FOSSA — 最全面,企业广泛使用
- Snyk Open Source — 适合开发团队工作流,集成 GitHub
- Black Duck — 并购尽调的标配
每个工具都能扫描你的代码库、标记与已知开源库匹配的代码,并识别对应许可证。如果你在交付商业产品且从未跑过扫描,目前所有决策都建立在假设上。一次扫描花半天时间,成本远低于版权纠纷第一小时的律师费。
2. 在工作过程中记录人类创意贡献
证明"实质性人类创作"所需要的证据,和你在正常工程工作流中本来就会产出的东西是同一类。区别只在于是否刻意保存,而不是让它自然消失。
需要保留的东西:
-
提交信息,要说明你改了什么、为什么改,而不只是 AI 生成了什么。“重构了 Claude 的模块架构,拒绝了最初的状态管理方案,从头重写了错误处理"是证据,“添加限流模块"不是。
-
Prompt 记录。Claude Code 和 Cursor 都保留交互历史,把你做了重要架构决策的那些对话导出或截图保存。
-
架构设计文档、ADR、任何早于生成代码的笔记,能证明你在 AI 动手之前就确定了结构。
前者和后者的区别,是"可以辩护的作者权主张"和"Claude 写的代码的干净记录"之间的区别。
3. 在做副业项目之前,先读合同里的 IP 条款
打开合同,搜索"知识产权”、“IP 转让"或"工作成果”,仔细读那一节。具体措辞决定你的风险暴露:
- “雇佣期间工作时间内创建的工作成果"比"使用公司资源创建的工作成果"范围窄
- “与公司业务相关"比"任何软件开发"范围窄
- “公司授权工具"是那个会把 AI 编程工具纳入其中、甚至覆盖个人项目的短语
如果条款范围宽,想独立构建项目,你有三个现实选择:在开始之前谈判书面豁免(入职初期比在职中途容易);使用完全个人的工具、完全个人的时间、个人设备;或者接受这个主张的存在,判断风险是否值得承担。
4. 确认你使用的是哪个 Anthropic 套餐
去查一下你用的是哪个档位的 Anthropic 服务。区别在于:
- 消费者服务条款(免费和 Pro):Anthropic 将输出权利转让给你,但 IP 赔偿范围更窄,覆盖的场景更少。
- 商业条款(API 和企业):Anthropic 将输出权利转让给你,并会为你因授权使用服务及其输出而产生的版权侵权主张进行辩护。
如果你用免费或 Pro 套餐在商业产品中交付 AI 辅助代码,这个赔偿差距是真实存在的。API 或企业协议才是合适的档位。
注意:两种赔偿都不覆盖代码库中的 GPL 污染问题。那是你自己需要通过许可证扫描来解决的治理问题。
值得认真想一想的事
Anthropic 自己的首席工程师公开表示,他最近对 Claude Code 的贡献是完全由 AI 写的;而 Anthropic 对某个泄露代码库发出了 8000 次 DMCA 删除请求,那个代码库可能也主要是 AI 创作的。Anthropic 对那个代码库的版权主张是否在法律上站得住脚,目前还没有法院给出答案。
如果构建了这个工具的公司都无法清晰主张对自己 AI 辅助代码的版权,那么你能不能主张,在这个问题出现在一笔交易、一场纠纷或一次收购谈判中之前,是值得认真想一想的。
从一开始就记录自己创意贡献的开发者,和接受了三千行 Claude 输出直接合并的开发者,处于截然不同的法律位置——即便他们交付了同样的产品。
最后说明一下这篇文章的边界:
已经确定的: 缺乏人类作者的作品不受版权保护;职务作品原则无论代码如何生成都适用;逐字复制 GPL 代码违反许可证。
有共识但没有权威裁决的: 在 Agentic 工作流中多少人类指导才算足够;AI 输出如果复现了训练数据模式是否算逐字复制。
这些悬而未决的问题,今天最具体地体现在 M&A 尽调和机构融资中——收购方和投资方已经把这些问题作为交割条件在问了。如果这两件事目前都不适用于你,上面四件事仍然值得做,只是紧迫程度没那么高。
关于
关注我获取更多资讯
原文:Who Owns the Code Claude Wrote?,作者 Sena Evren / Legal Layer,本文为编译整理,许可协议 CC BY-SA 4.0。