摘要

Claw-Code(https://github.com/instructkr/claw-code)是一个在 2026 年 3 月 31 日 Claude Code 源代码泄露事件后迅速诞生的开源项目。该项目采用干净室重实现(clean-room reimplementation)方法,用 Python 从零重构了 Anthropic Claude Code 的核心 agent harness(代理框架) 架构,而非直接分发泄露源码。目前项目已实现命令系统、工具集成、子系统清单和工作空间清单的镜像,并计划转向 Rust 重写。本文通过对仓库 README、源代码结构和 CLI 功能的详细分析,探讨其技术价值、伦理意义以及对开源 LLM Agent 框架设计的启示。研究表明,Claw-Code 并非简单存档,而是为“Better Harness Tools”提供了可验证、可扩展的工程参考,具有重要的学术与工程意义。

1. 引言

2026 年 3 月 31 日凌晨,Anthropic 的 Claude Code(一款命令行编码代理工具,能够读写文件、运行测试、操作本地环境)源代码意外泄露,迅速在开发者社区引发热议。该事件被形容为“自 Llama 1 以来最大的 AI 意外泄露”。

在法律与伦理压力下,韩国开发者 Sigrid Jin(instructkr)于数小时内完成从零端口,创建了 Claw-Code 项目。其核心理念明确写在仓库标题中:

“Better Harness Tools, not merely storing the archive of leaked Claude Code but also make shit things done. Now rewriting in Rust.”

项目一经发布即创下 GitHub 历史纪录——数小时内突破 3 万星标,目前已达 38.7K 星标、49.6K forks。 本文旨在系统剖析其技术实现、开发流程与潜在影响,为 LLM Agent 研究社区提供参考。

2. 背景:Claude Code 与 Agent Harness

Claude Code 是 Anthropic 推出的长期运行编码代理(long-running coding agent),其核心在于 agent harness——一套负责工具编排(tool wiring)、任务编排(orchestration)、上下文管理(context management)和子系统调度的框架。Anthropic 官方文档曾多次强调 harness 设计对长时程代理性能的关键作用。

传统开源 Agent 框架(如 LangChain、CrewAI)多依赖提示工程,而 Claude Code 的 harness 在子系统隔离、命令元数据、工具清单和清单审计(manifest & parity)等方面展现了更工程化的设计。这正是 Claw-Code 聚焦重构的部分。

3. 方法论:干净室重实现

Claw-Code 严格遵循干净室工程原则:

  • 不保留任何泄露的 TypeScript 原始代码作为跟踪状态;
  • 开发者通过阅读泄露源码后,从零用 Python 重写核心元数据与结构;
  • 整个端口过程由 AI 编排工具 oh-my-codex (OmX) 驱动,使用 $team 模式并行审查和 $ralph 模式持久执行验证。

仓库中附带一篇自述文章《2026-03-09-is-legal-the-same-as-legitimate-ai-reimplementation-and-the-erosion-of-copyleft.md》,详细阐述了从法律合规转向“合法性”重实现的伦理考量。项目明确声明:

  • 不拥有原 Claude Code 源码;
  • 与 Anthropic 无任何关联。

此方法既规避了版权风险,又为开源社区提供了可审计、可复现的架构蓝图。

4. 系统架构分析

Claw-Code 的 Python 端口(src/ 目录)完整镜像了原 harness 的关键组件:

组件文件功能描述
入口与 CLImain.py提供 summary、manifest 等命令
模型定义models.py子系统、模块、backlog 的数据类
命令元数据commands.py镜像原命令清单
工具元数据tools.py镜像原工具集成清单
清单生成port_manifest.py生成当前工作空间结构总结
查询引擎query_engine.py渲染端口总结报告
任务支持task.py辅助任务状态管理

关键特性

  • 通过 python3 -m src.main manifest 可输出完整工作空间清单;
  • subsystems --limit 16、commands --limit 10、tools --limit 10 可快速审计架构一致性;
  • parity-audit 命令支持与本地归档(ignored)的对比验证(当前端口在清单级已高度一致,但运行时切片尚不完整)。

测试套件(tests/)确保端口正确性。assets/omx/ 目录保留了 OmX 工作流截图,直观展示了 AI 辅助开发的实际过程。

5. 使用与评估

安装与运行极为简便(仅需 Python 3,无额外依赖):

Bash

git clone https://github.com/instructkr/claw-code.git cd claw-code python3 -m src.main summary # 查看端口总结 python3 -m src.main manifest # 输出工作空间清单 python3 -m unittest discover -s tests -v # 运行验证测试

当前评估:Python 端口已实现架构级 parity(子系统名称、命令/工具清单高度一致),但尚未达到“完整运行时替代品”。这正是项目下一步 Rust 重写的动机——追求更高性能与完整功能。

6. 讨论

技术价值:Claw-Code 为研究 LLM Agent harness 提供了公开、可执行的参考样本,尤其在工具编排、上下文持久化和清单驱动开发方面。开发者可借此快速理解 Claude Code 的设计精髓,并应用于自身项目(如 OpenClaw、ClaudeClaw 等衍生工具)。

伦理与法律意义:项目开创了“泄露后干净室重构”的新范式,平衡了知识传播与知识产权保护,为 AI 社区提供了可复制的伦理模板。

局限与未来

  • 仍处于早期阶段,运行时能力有限;
  • Rust 重写尚未启动,但明确列入路线图;
  • 社区协作主要通过 instructkr Discord(https://instruct.kr/)进行。

与同期项目(如 TinyClaw、ClaudeClaw)相比,Claw-Code 更侧重架构研究而非即用工具,体现了“研究先行”的定位。

7. 结论

Claw-Code 并非简单的代码存档,而是 Claude Code 泄露事件催生的“工程回应”——通过干净室方法将私有 harness 转化为开源可研究的知识资产。其 Python 端口与即将到来的 Rust 重写,为开源 LLM Agent 框架设计提供了宝贵蓝图。未来若能实现完整运行时 parity,将进一步推动“Better Harness Tools”的社区实践。

建议研究者克隆仓库、运行 CLI 命令,并参与 Discord 讨论,以深入理解 harness 工程的最新前沿。

参考文献

  1. instructkr. (2026). claw-code GitHub 仓库 [Online]. Available: https://github.com/instructkr/claw-code
  2. README.md 完整内容(2026-03-31 更新)
  3. Anthropic Engineering Blog: Harness Design for Long-Running Applications
  4. 相关 X 讨论与 WSJ 报道(2026 年 3 月)

主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。