Harness Engineering 让程序员更浮躁了吗？

2025 年发明了 Vibe Coding，2026 年改名叫 Harness Engineering。名字在变，但程序员的焦虑没变。

一个分裂的评论区

最近刷到一条知乎问答：“为什么我感觉 Vibe Coding 让程序员更浮躁了？”

377 个回答，2036 个关注。评论区形成了两种声音：

AI降临派	AI怀疑派
AI 能力很强，会改变程序员的工作方式	AI 还不成熟，但确实在推动行业变化
前端和测试岗位受影响较大	这是行业调整，AI 不该背全部锅
Vibe Coding 代表新趋势，值得学习	过度依赖会导致技能退化
Karpathy 公开说自己现在很少写代码	但他仍在深度参与 AI 领域

还有第三种人——“双面玩家”。

表面上拥抱 AI，汇报时说”提效明显”；实际上 AI 并没有宣传的那么好用，但指标已经报上去了，缺口只能自己加班补。

浮躁的真正来源，是 AI 来了之后的人心。

恐慌的人：怕被淘汰，拼命追每个新工具
膨胀的人：用过一点 AI，就觉得自己无敌了

这两种心态互相影响——恐慌的人越追越焦虑，膨胀的人越看越自信。

而资本在背后推波助澜：该裁员的裁员，该降本的降本。用什么工具不重要，能不能省钱才重要。

Vibe Coding 没有让人浮躁，是这个”优胜劣汰”的环境让人浮躁。AI 只是那根导火索。

三种编程范式的”内卷”

抖音上 vibe coding、harness engineering、SDD（Spec-Driven Development）很火。看起来是新概念，实际上是同一件事的不同层次。

范式	核心思想	问题
Vibe Coding	口喷写代码，接受一切，祈祷运行	AI 说啥信啥，从不验证
SDD	先写 Spec 文档，再让 AI 执行	Spec 也是 AI 写的，谁来验证？
Harness Engineering	模型 + 环境 + 工具 + 流程	工程化成本高，小团队用不上

LangChain 做过一个实验：同一个模型（GPT-5.2-Codex），只改 Harness——退出前强制自检、注入环境信息、死循环检测——得分从 52.8 涨到 66.5，排名从 Top 30 冲到 Top 5。

模型一丁点没换，换的全是 Harness。

这个实验告诉我们：很多时候你觉得 Agent 不行，其实是你给它搭的”台子”没搭好。

但问题是：谁有时间和精力去搭这个台子？

浮躁的本质：只想吃肉，不想养猪

Vibe Coding 被批评的核心问题是什么？

Anthropic 做过一组对照实验：

使用 AI 辅助的程序员，考试成绩平均低 17%
调试能力差距最大，耗时与手动组无显著差异
部分用户花费 30% 时间优化提示词，形成”交互税”

更残酷的现实是：很多公司裁员后发现，需要招回被开掉的程序员收拾”Vibe-Code”烂摊子。

亚马逊的员工吐槽：

“以前我的工作是写代码，现在的工作是修 AI 写坏的代码。”

这就是浮躁的代价——

你花了 10 分钟让 AI 生成代码，却花了 3 小时去调试它写的 bug。

为什么 Harness Engineering 被捧上神坛？

2026 年 3 月，Harness Engineering 突然火了。

LangChain 的定义很简洁：

Agent = Model + Harness. If you’re not the model, you’re the harness.

翻译：Agent 不只是一个模型，而是一个系统。模型负责思考，Harness 负责环境、工具、流程、约束。

核心思想是：当 Agent 犯了一个错，你花时间去设计一个解决方案，让这个 Agent 永远不再犯这个错。

这不是改 prompt，而是改环境、加流程、建护栏——从架构层面把错误堵死。

听起来很美好。但问题是：

小团队哪有时间搭 Harness？
个人开发者哪有资源维护测试基础设施？
你连 TDD 都没做好，讨论 Harness 有什么意义？

大多数人的状态是：Vibe Coding 用不明白，Harness Engineering 搭不起来。

六类 AI 使用者的两极分化

根据行业观察，AI 时代程序员正在分化成六类：

类型	特征	结果
甩手掌柜型	直接复制 AI 代码，从不验证	得分 < 40%，最先被淘汰
测试盲型	让 AI 既写代码又写测试	AI 自编自答，全绿上线崩
上下文堆积型	Session 无限累积，AI 越来越蠢	触发自动压缩 = 入门阶段
工具收集型	追逐每个新工具，不深挖任何一个	焦虑但无产出
批判使用型	AI 写骨架，自己审查每一行	成长速度超过老开发
工程化型	搭建 Harness，多角色分工	效率最高，但门槛也最高

第五种是个人成长的最优解，第六种是团队效率的最优解。不是二选一，而是递进关系：先做到第五种，再向第六种进化。

谷歌总监的警告

Chrome 工程大佬 Addy Osmani 说过一句很直白的话：

The single biggest differentiator between agentic engineering and vibe coding is testing.

测试。就这么简单。

让同一个 agent 既写代码又写测试，相当于让考生自己出卷自己答——AI 每次都满分，上线就崩盘。

谷歌总监更狠：只会写 Prompt 的程序员，2026 年将被淘汰。

浮躁的根源：不是工具，是心态

回到最初的问题：Vibe Coding 让程序员更浮躁了吗？

我的答案是：Vibe Coding 只是放大镜，浮躁一直都在。

以前浮躁的表现：

追逐每个新框架，不深挖任何一个
复制粘贴 Stack Overflow，不理解原理
业务代码写得快，遇到 bug 就懵

现在浮躁的表现：

追逐每个新 AI 工具，不深挖任何一个
复制粘贴 AI 生成的代码，不理解原理
Vibe Coding 写得快，遇到 bug 就甩给 AI

工具在变，心态没变。

写在最后

程序员不需要焦虑 AI 会不会抢饭碗。

程序员不需要追逐每一个 AI 工具的热点。

程序员只需要做一件事：保持思考，保持提问，保持对代码的控制权。

AI 是你的工具，不是你的替代者。

当你能用 AI 写代码，但依然能说出”这行代码为什么这么写”的时候，你就已经赢了。

“Vibe Coding 是 2025 年最糟糕的想法”——Dave Farley

“Agent = Model + Harness”——LangChain

这两个观点，看似矛盾，实则统一。

糟糕的不是 Vibe Coding 本身，是只用 Vibe Coding，不用 Harness Engineering。

参考来源：LangChain《The Anatomy of an Agent Harness》、HumanLayer《Skill Issue: Harness Engineering for Coding Agents》、Anthropic 实验数据、虎嗅《Vibe Coding，是怎么”玩废”程序员的？》