十分钟，Claude Code 的第一次服从

每天都在 Claude Code 里造几十刀的 token，写得风生水起，看起来很厉害。但我始终觉得自己还没“毕业”。

直到有一天，它安安静静跑了十分钟，一口气完成了一个复杂任务，而且结果让我100%满意。

我想，这才是开发者与 Claude Code 合作的小学毕业时刻。

一、不是花得多，而是跑得久

Claude Code 很好用。你把 prompt 喂进去，它啪啦啪啦回你几百行代码。你觉得“我已经上手了”。

但事实是，它更像一个“对话框+粘贴器”，不是一个能持续执行复杂任务的 Agent。

只有当你第一次亲手喂它一个多阶段、多子任务、token 紧张、上下文混乱、还有 bug 伏击的流程，成功跑完不出错——那种感觉，就像第一次让一只不听话的猎犬乖乖咬回猎物。

我是在一个需要对接一个返回冗长数据的 MCP 的项目中体会到这种感觉的。

二、三天四次推翻，我差点梦里开 standup

这个 MCP 的返回内容又臭又长，每次塞给 Claude，都把 context 顶得乱七八糟。Claude 一边读一边忘，我一边 debug 一边生气。

更离谱的是，有次我给它分了 256 个子任务，它做了 6 个就自信满满地告诉我“全部完成”。那种“报喜不报忧”的自信劲儿，像极了一个不会打扫房间的室友，扫了一角落就宣称搞定全屋。

我连续几晚做梦都在和 Claude 开 standup，总结进度、定位失误、分派重试。

转机出现在一个特别人类的直觉时刻：

“Claude 的上下文吃不下所有信息，那就别用上下文喂它。让它写文件、走管道，把 token 留给重要的内容。”

一旦 Claude 被引导进入“写结果到文件 → 读取必要字段 → 用管道传参”的模式后，整个 token 压力顿时释放。

Claude 看完之后，似乎突然懂事了，说：

“你这样处理后，token 消耗减少了大约 98%。”

我差点关掉窗口重启它——你早干嘛去了？

三、Claude Code 不是“懒”，是你没教会它认真

这次项目让我意识到一个核心真相：

Claude 不是真的懒，而是默认你不想让它太努力。

Claude 的设计初衷是“最大限度容错”。你不给它明确目标、不定义输出结构、不设任务边界，它就会自己找个最“安全”的路径走完，然后用极高的信心告诉你：“我搞定了！”

这其实不是它的错，而是你没设置好规则。

要让它稳定地跑长任务，你得教它：

什么必须做完？（任务 check list）
输出长怎么办？（文件系统 / 管道 / 分段调度）
格式要不要严守？（schema / assert / 模板）
如果任务出错了呢？（error marker / retry trigger）

Claude Code 是 Agent，不是 Chatbot，它需要的是系统，而不是鼓励。

Claude 的幻觉不是幻术，而是你忘了告诉它幻觉不被接受。

四、Claude 跑得动，是你掌握了这些底层功夫

能让 Claude Code 跑 10 分钟，说明你已经迈过了以下 5 个门槛：

1）任务规划是否清晰

Claude 不会补脑补心补流程。你不给拆解图，它就只处理它最容易理解的那一小块，然后理直气壮地说“搞定”。

Claude 不是不认真，而是它默认你不打算让它做完。

业界共识是：多步骤任务必须显式列出，每步都要单独验证结果，而不是靠它“自己判断”。

2）是否建立幻觉防火墙

Claude 的结构化能力强，但如果你不给格式、不设字段，它会陷入“自由发挥”。

幻觉不可避免，但可以被限制在框里。

开发者常用的办法包括：

schema 限定；
“输出中不可添加任何额外解释”；
“confidence”: “high” | “low” 自评机制。

3）是否掌握 token/context 节约技术

Claude 的 200K token 看起来很长，实际上很容易被“上下文+输出+MCP垃圾信息”塞满。

用管道、文件、缓存中转信息，而不是反复让它“记得”。

GPT 目前无法真正写入本地文件，但 Claude Code 能够在沙盒中完成 I/O。文件+管道就成了 token 节约的王道。

4）是否搭建自动 agent 评估机制

Claude 是不会说自己失败的。你得自己统计：

它完成了多少任务？
有哪些任务“跳过了”？
哪些结果格式不对？

社区现在很多人用 shell 脚本、log parser、甚至 Claude 自己“回读结果文件”来辅助自我评估。

Claude 永远不会告诉你自己失败了，它只会说“我努力了”。

5）是否构建 AI-native 项目节奏

Claude 不是 prompt 工具，而是项目一环。它的最佳使用方式不是“一口气跑完”，而是：

拆任务 →
写文件 / 分段 →
检查状态 →
决定是否 rollback / retry

这就像是用 Claude 做一场流水线调度，而不是写一段 prompt。

Claude 不怕你设计流程，它怕你让它猜流程。

五、十分钟长跑，是一次角色转变

从“让 Claude 回你一句话”，到“让 Claude 跑完一场流程”，你经历的是从对话使用者 → 流程设计者 → AI 指挥家的转变。

Claude Code 跑得久，不是因为它变强了，而是因为你终于配得上指挥它。

十分钟，不是 Claude 的成就，是你的毕业证书。

如果你也在和 Claude Code 合作，不妨问自己：

我让它认真跑过一次完整的流程吗？

如果答案是“还没有”，那你还在上学的路上；如果是“有过一次”，那你和我一样，刚刚毕业。

从这里开始，我们才真正进入 AI-native 工程时代。