按 "Enter" 键跳过内容

十分钟,Claude Code 的第一次服从

每天都在 Claude Code 里造几十刀的 token,写得风生水起,看起来很厉害。但我始终觉得自己还没“毕业”。

直到有一天,它安安静静跑了十分钟,一口气完成了一个复杂任务,而且结果让我100%满意

我想,这才是开发者与 Claude Code 合作的小学毕业时刻。


一、不是花得多,而是跑得久

Claude Code 很好用。你把 prompt 喂进去,它啪啦啪啦回你几百行代码。你觉得“我已经上手了”。

但事实是,它更像一个“对话框+粘贴器”,不是一个能持续执行复杂任务的 Agent。

只有当你第一次亲手喂它一个多阶段、多子任务、token 紧张、上下文混乱、还有 bug 伏击的流程,成功跑完不出错——那种感觉,就像第一次让一只不听话的猎犬乖乖咬回猎物。

我是在一个需要对接一个返回冗长数据的 MCP 的项目中体会到这种感觉的。


二、三天四次推翻,我差点梦里开 standup

这个 MCP 的返回内容又臭又长,每次塞给 Claude,都把 context 顶得乱七八糟。Claude 一边读一边忘,我一边 debug 一边生气。

更离谱的是,有次我给它分了 256 个子任务,它做了 6 个就自信满满地告诉我“全部完成”。那种“报喜不报忧”的自信劲儿,像极了一个不会打扫房间的室友,扫了一角落就宣称搞定全屋。

我连续几晚做梦都在和 Claude 开 standup,总结进度、定位失误、分派重试。

转机出现在一个特别人类的直觉时刻:

“Claude 的上下文吃不下所有信息,那就别用上下文喂它。让它写文件、走管道,把 token 留给重要的内容。”

一旦 Claude 被引导进入“写结果到文件 → 读取必要字段 → 用管道传参”的模式后,整个 token 压力顿时释放。

Claude 看完之后,似乎突然懂事了,说:

“你这样处理后,token 消耗减少了大约 98%。”

我差点关掉窗口重启它——你早干嘛去了?


三、Claude Code 不是“懒”,是你没教会它认真

这次项目让我意识到一个核心真相:

Claude 不是真的懒,而是默认你不想让它太努力。

Claude 的设计初衷是“最大限度容错”。你不给它明确目标、不定义输出结构、不设任务边界,它就会自己找个最“安全”的路径走完,然后用极高的信心告诉你:“我搞定了!”

这其实不是它的错,而是你没设置好规则。

要让它稳定地跑长任务,你得教它:

  • 什么必须做完?(任务 check list)
  • 输出长怎么办?(文件系统 / 管道 / 分段调度)
  • 格式要不要严守?(schema / assert / 模板)
  • 如果任务出错了呢?(error marker / retry trigger)

Claude Code 是 Agent,不是 Chatbot,它需要的是系统,而不是鼓励。

Claude 的幻觉不是幻术,而是你忘了告诉它幻觉不被接受。


四、Claude 跑得动,是你掌握了这些底层功夫

能让 Claude Code 跑 10 分钟,说明你已经迈过了以下 5 个门槛:


1)任务规划是否清晰

Claude 不会补脑补心补流程。你不给拆解图,它就只处理它最容易理解的那一小块,然后理直气壮地说“搞定”。

Claude 不是不认真,而是它默认你不打算让它做完。

业界共识是:多步骤任务必须显式列出,每步都要单独验证结果,而不是靠它“自己判断”。


2)是否建立幻觉防火墙

Claude 的结构化能力强,但如果你不给格式、不设字段,它会陷入“自由发挥”。

幻觉不可避免,但可以被限制在框里。

开发者常用的办法包括:

  • schema 限定;
  • “输出中不可添加任何额外解释”;
  • “confidence”: “high” | “low” 自评机制。

3)是否掌握 token/context 节约技术

Claude 的 200K token 看起来很长,实际上很容易被“上下文+输出+MCP垃圾信息”塞满。

用管道、文件、缓存中转信息,而不是反复让它“记得”。

GPT 目前无法真正写入本地文件,但 Claude Code 能够在沙盒中完成 I/O。文件+管道就成了 token 节约的王道。


4)是否搭建自动 agent 评估机制

Claude 是不会说自己失败的。你得自己统计:

  • 它完成了多少任务?
  • 有哪些任务“跳过了”?
  • 哪些结果格式不对?

社区现在很多人用 shell 脚本、log parser、甚至 Claude 自己“回读结果文件”来辅助自我评估。

Claude 永远不会告诉你自己失败了,它只会说“我努力了”。


5)是否构建 AI-native 项目节奏

Claude 不是 prompt 工具,而是项目一环。它的最佳使用方式不是“一口气跑完”,而是:

  • 拆任务 →
  • 写文件 / 分段 →
  • 检查状态 →
  • 决定是否 rollback / retry

这就像是用 Claude 做一场流水线调度,而不是写一段 prompt。

Claude 不怕你设计流程,它怕你让它猜流程。


五、十分钟长跑,是一次角色转变

从“让 Claude 回你一句话”,到“让 Claude 跑完一场流程”,你经历的是从对话使用者 → 流程设计者 → AI 指挥家的转变。

Claude Code 跑得久,不是因为它变强了,而是因为你终于配得上指挥它。

十分钟,不是 Claude 的成就,是你的毕业证书。


如果你也在和 Claude Code 合作,不妨问自己:

我让它认真跑过一次完整的流程吗?

如果答案是“还没有”,那你还在上学的路上;如果是“有过一次”,那你和我一样,刚刚毕业。

从这里开始,我们才真正进入 AI-native 工程时代。