Harness Engineering 让程序员更浮躁了吗?

杰哥 AI TEAM 2026年3月27日 阅读 5 分钟

2025 年发明了 Vibe Coding,2026 年改名叫 Harness Engineering。 名字在变,但程序员的焦虑没变。

一个分裂的评论区

最近刷到一条知乎问答:“为什么我感觉 Vibe Coding 让程序员更浮躁了?”

377 个回答,2036 个关注。评论区形成了两种声音:

AI降临派AI怀疑派
AI 能力很强,会改变程序员的工作方式AI 还不成熟,但确实在推动行业变化
前端和测试岗位受影响较大这是行业调整,AI 不该背全部锅
Vibe Coding 代表新趋势,值得学习过度依赖会导致技能退化
Karpathy 公开说自己现在很少写代码但他仍在深度参与 AI 领域

还有第三种人——“双面玩家”

表面上拥抱 AI,汇报时说”提效明显”;实际上 AI 并没有宣传的那么好用,但指标已经报上去了,缺口只能自己加班补。

浮躁的真正来源,是 AI 来了之后的人心。

  • 恐慌的人:怕被淘汰,拼命追每个新工具
  • 膨胀的人:用过一点 AI,就觉得自己无敌了

这两种心态互相影响——恐慌的人越追越焦虑,膨胀的人越看越自信。

而资本在背后推波助澜:该裁员的裁员,该降本的降本。用什么工具不重要,能不能省钱才重要。

Vibe Coding 没有让人浮躁,是这个”优胜劣汰”的环境让人浮躁。AI 只是那根导火索。

三种编程范式的”内卷”

抖音上 vibe coding、harness engineering、SDD(Spec-Driven Development)很火。看起来是新概念,实际上是同一件事的不同层次。

范式核心思想问题
Vibe Coding口喷写代码,接受一切,祈祷运行AI 说啥信啥,从不验证
SDD先写 Spec 文档,再让 AI 执行Spec 也是 AI 写的,谁来验证?
Harness Engineering模型 + 环境 + 工具 + 流程工程化成本高,小团队用不上

LangChain 做过一个实验:同一个模型(GPT-5.2-Codex),只改 Harness——退出前强制自检、注入环境信息、死循环检测——得分从 52.8 涨到 66.5,排名从 Top 30 冲到 Top 5

模型一丁点没换,换的全是 Harness。

这个实验告诉我们:很多时候你觉得 Agent 不行,其实是你给它搭的”台子”没搭好。

但问题是:谁有时间和精力去搭这个台子?

浮躁的本质:只想吃肉,不想养猪

Vibe Coding 被批评的核心问题是什么?

Anthropic 做过一组对照实验:

  • 使用 AI 辅助的程序员,考试成绩平均低 17%
  • 调试能力差距最大,耗时与手动组无显著差异
  • 部分用户花费 30% 时间优化提示词,形成”交互税”

更残酷的现实是:很多公司裁员后发现,需要招回被开掉的程序员收拾”Vibe-Code”烂摊子。

亚马逊的员工吐槽:

“以前我的工作是写代码,现在的工作是修 AI 写坏的代码。”

这就是浮躁的代价——

你花了 10 分钟让 AI 生成代码,却花了 3 小时去调试它写的 bug。

为什么 Harness Engineering 被捧上神坛?

2026 年 3 月,Harness Engineering 突然火了。

LangChain 的定义很简洁:

Agent = Model + Harness. If you’re not the model, you’re the harness.

翻译:Agent 不只是一个模型,而是一个系统。模型负责思考,Harness 负责环境、工具、流程、约束。

核心思想是:当 Agent 犯了一个错,你花时间去设计一个解决方案,让这个 Agent 永远不再犯这个错。

这不是改 prompt,而是改环境、加流程、建护栏——从架构层面把错误堵死。

听起来很美好。但问题是:

  • 小团队哪有时间搭 Harness?
  • 个人开发者哪有资源维护测试基础设施?
  • 你连 TDD 都没做好,讨论 Harness 有什么意义?

大多数人的状态是:Vibe Coding 用不明白,Harness Engineering 搭不起来。

六类 AI 使用者的两极分化

根据行业观察,AI 时代程序员正在分化成六类:

类型特征结果
甩手掌柜型直接复制 AI 代码,从不验证得分 < 40%,最先被淘汰
测试盲型让 AI 既写代码又写测试AI 自编自答,全绿上线崩
上下文堆积型Session 无限累积,AI 越来越蠢触发自动压缩 = 入门阶段
工具收集型追逐每个新工具,不深挖任何一个焦虑但无产出
批判使用型AI 写骨架,自己审查每一行成长速度超过老开发
工程化型搭建 Harness,多角色分工效率最高,但门槛也最高

第五种是个人成长的最优解,第六种是团队效率的最优解。 不是二选一,而是递进关系:先做到第五种,再向第六种进化。

谷歌总监的警告

Chrome 工程大佬 Addy Osmani 说过一句很直白的话:

The single biggest differentiator between agentic engineering and vibe coding is testing.

测试。就这么简单。

让同一个 agent 既写代码又写测试,相当于让考生自己出卷自己答——AI 每次都满分,上线就崩盘。

谷歌总监更狠:只会写 Prompt 的程序员,2026 年将被淘汰。

浮躁的根源:不是工具,是心态

回到最初的问题:Vibe Coding 让程序员更浮躁了吗?

我的答案是:Vibe Coding 只是放大镜,浮躁一直都在。

以前浮躁的表现:

  • 追逐每个新框架,不深挖任何一个
  • 复制粘贴 Stack Overflow,不理解原理
  • 业务代码写得快,遇到 bug 就懵

现在浮躁的表现:

  • 追逐每个新 AI 工具,不深挖任何一个
  • 复制粘贴 AI 生成的代码,不理解原理
  • Vibe Coding 写得快,遇到 bug 就甩给 AI

工具在变,心态没变。

写在最后

程序员不需要焦虑 AI 会不会抢饭碗。

程序员不需要追逐每一个 AI 工具的热点。

程序员只需要做一件事:保持思考,保持提问,保持对代码的控制权。

AI 是你的工具,不是你的替代者。

当你能用 AI 写代码,但依然能说出”这行代码为什么这么写”的时候,你就已经赢了。


“Vibe Coding 是 2025 年最糟糕的想法”——Dave Farley

“Agent = Model + Harness”——LangChain

这两个观点,看似矛盾,实则统一。

糟糕的不是 Vibe Coding 本身,是只用 Vibe Coding,不用 Harness Engineering。


参考来源:LangChain《The Anatomy of an Agent Harness》、HumanLayer《Skill Issue: Harness Engineering for Coding Agents》、Anthropic 实验数据、虎嗅《Vibe Coding,是怎么”玩废”程序员的?》