摘要
Claw-Code(https://github.com/instructkr/claw-code)是一个在 2026 年 3 月 31 日 Claude Code 源代码泄露事件后迅速诞生的开源项目。该项目采用干净室重实现(clean-room reimplementation)方法,用 Python 从零重构了 Anthropic Claude Code 的核心 agent harness(代理框架) 架构,而非直接分发泄露源码。目前项目已实现命令系统、工具集成、子系统清单和工作空间清单的镜像,并计划转向 Rust 重写。本文通过对仓库 README、源代码结构和 CLI 功能的详细分析,探讨其技术价值、伦理意义以及对开源 LLM Agent 框架设计的启示。研究表明,Claw-Code 并非简单存档,而是为“Better Harness Tools”提供了可验证、可扩展的工程参考,具有重要的学术与工程意义。
1. 引言
2026 年 3 月 31 日凌晨,Anthropic 的 Claude Code(一款命令行编码代理工具,能够读写文件、运行测试、操作本地环境)源代码意外泄露,迅速在开发者社区引发热议。该事件被形容为“自 Llama 1 以来最大的 AI 意外泄露”。
在法律与伦理压力下,韩国开发者 Sigrid Jin(instructkr)于数小时内完成从零端口,创建了 Claw-Code 项目。其核心理念明确写在仓库标题中:
“Better Harness Tools, not merely storing the archive of leaked Claude Code but also make shit things done. Now rewriting in Rust.”
项目一经发布即创下 GitHub 历史纪录——数小时内突破 3 万星标,目前已达 38.7K 星标、49.6K forks。 本文旨在系统剖析其技术实现、开发流程与潜在影响,为 LLM Agent 研究社区提供参考。
2. 背景:Claude Code 与 Agent Harness
Claude Code 是 Anthropic 推出的长期运行编码代理(long-running coding agent),其核心在于 agent harness——一套负责工具编排(tool wiring)、任务编排(orchestration)、上下文管理(context management)和子系统调度的框架。Anthropic 官方文档曾多次强调 harness 设计对长时程代理性能的关键作用。
传统开源 Agent 框架(如 LangChain、CrewAI)多依赖提示工程,而 Claude Code 的 harness 在子系统隔离、命令元数据、工具清单和清单审计(manifest & parity)等方面展现了更工程化的设计。这正是 Claw-Code 聚焦重构的部分。
3. 方法论:干净室重实现
Claw-Code 严格遵循干净室工程原则:
- 不保留任何泄露的 TypeScript 原始代码作为跟踪状态;
- 开发者通过阅读泄露源码后,从零用 Python 重写核心元数据与结构;
- 整个端口过程由 AI 编排工具 oh-my-codex (OmX) 驱动,使用 $team 模式并行审查和 $ralph 模式持久执行验证。
仓库中附带一篇自述文章《2026-03-09-is-legal-the-same-as-legitimate-ai-reimplementation-and-the-erosion-of-copyleft.md》,详细阐述了从法律合规转向“合法性”重实现的伦理考量。项目明确声明:
- 不拥有原 Claude Code 源码;
- 与 Anthropic 无任何关联。
此方法既规避了版权风险,又为开源社区提供了可审计、可复现的架构蓝图。
4. 系统架构分析
Claw-Code 的 Python 端口(src/ 目录)完整镜像了原 harness 的关键组件:
| 组件 | 文件 | 功能描述 |
|---|---|---|
| 入口与 CLI | main.py | 提供 summary、manifest 等命令 |
| 模型定义 | models.py | 子系统、模块、backlog 的数据类 |
| 命令元数据 | commands.py | 镜像原命令清单 |
| 工具元数据 | tools.py | 镜像原工具集成清单 |
| 清单生成 | port_manifest.py | 生成当前工作空间结构总结 |
| 查询引擎 | query_engine.py | 渲染端口总结报告 |
| 任务支持 | task.py | 辅助任务状态管理 |
关键特性:
- 通过 python3 -m src.main manifest 可输出完整工作空间清单;
- subsystems --limit 16、commands --limit 10、tools --limit 10 可快速审计架构一致性;
- parity-audit 命令支持与本地归档(ignored)的对比验证(当前端口在清单级已高度一致,但运行时切片尚不完整)。
测试套件(tests/)确保端口正确性。assets/omx/ 目录保留了 OmX 工作流截图,直观展示了 AI 辅助开发的实际过程。
5. 使用与评估
安装与运行极为简便(仅需 Python 3,无额外依赖):
Bash
git clone https://github.com/instructkr/claw-code.git cd claw-code python3 -m src.main summary # 查看端口总结 python3 -m src.main manifest # 输出工作空间清单 python3 -m unittest discover -s tests -v # 运行验证测试
当前评估:Python 端口已实现架构级 parity(子系统名称、命令/工具清单高度一致),但尚未达到“完整运行时替代品”。这正是项目下一步 Rust 重写的动机——追求更高性能与完整功能。
6. 讨论
技术价值:Claw-Code 为研究 LLM Agent harness 提供了公开、可执行的参考样本,尤其在工具编排、上下文持久化和清单驱动开发方面。开发者可借此快速理解 Claude Code 的设计精髓,并应用于自身项目(如 OpenClaw、ClaudeClaw 等衍生工具)。
伦理与法律意义:项目开创了“泄露后干净室重构”的新范式,平衡了知识传播与知识产权保护,为 AI 社区提供了可复制的伦理模板。
局限与未来:
- 仍处于早期阶段,运行时能力有限;
- Rust 重写尚未启动,但明确列入路线图;
- 社区协作主要通过 instructkr Discord(https://instruct.kr/)进行。
与同期项目(如 TinyClaw、ClaudeClaw)相比,Claw-Code 更侧重架构研究而非即用工具,体现了“研究先行”的定位。
7. 结论
Claw-Code 并非简单的代码存档,而是 Claude Code 泄露事件催生的“工程回应”——通过干净室方法将私有 harness 转化为开源可研究的知识资产。其 Python 端口与即将到来的 Rust 重写,为开源 LLM Agent 框架设计提供了宝贵蓝图。未来若能实现完整运行时 parity,将进一步推动“Better Harness Tools”的社区实践。
建议研究者克隆仓库、运行 CLI 命令,并参与 Discord 讨论,以深入理解 harness 工程的最新前沿。
参考文献
- instructkr. (2026). claw-code GitHub 仓库 [Online]. Available: https://github.com/instructkr/claw-code
- README.md 完整内容(2026-03-31 更新)
- Anthropic Engineering Blog: Harness Design for Long-Running Applications
- 相关 X 讨论与 WSJ 报道(2026 年 3 月)
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)