提示词工程、上下文工程、驾驭工程：AI 编程从"能用"到"真干活"的三层路径

你以为学会提示词就够了

大多数人接触 AI 编程的第一课，都是提示词工程。逻辑很直接：大模型的本质是在预测”下一个词最可能是什么”，它只是在猜你想要什么。你给的指令越清晰，它猜得越准。

于是大家开始研究怎么写提示词——加角色设定、加背景、加输出格式、加限制条件……这没有错。提示词工程确实有用，它解决的是大模型无引导、乱说话的问题。

但我在实战中很快就撞到了天花板。提示词写得再好，只要项目稍微复杂一点，AI 给的结果就开始飘。不是因为提示词写得不够好，而是因为模型知道的信息不够。

你丢给它一个任务，它不知道你的项目背景，不知道你的技术栈，不知道你上次做了什么决策、为什么这么做。它每次都像一个刚入职的新员工，从零开始理解你的世界。

提示词解决的是”怎么说话”的问题，但没解决”说什么”的问题。

这就是上下文工程要做的事。发给大模型的所有信息，统称为上下文。提示词只是其中一部分。项目文档、历史对话、当前代码、报错信息……这些打包在一起，才是完整的上下文。

道理很简单：给的信息越精准，模型回答越准。但问题来了——大模型一次能处理的上下文有上限，叫上下文窗口。信息塞多了，就得压缩、就得丢弃。丢着丢着，关键信息没了，模型开始记不住，前后回答开始矛盾。这叫上下文腐化。

做过稍微长一点的 AI 编程任务的人，应该都遇到过这个感觉：越聊越跑偏，越改越乱。

上下文工程要解决的，就是在有限的窗口里，把最相关的信息在最合适的时机塞进去。具体怎么做？三步：召回、压缩、组装。找到最相关的信息，把它压缩到合适的体量，再按照对模型理解最有利的顺序组装好，然后发出去。

这也是为什么同一个模型，不同 AI 工具效果差这么多。Cursor、Claude Code、Windsurf，底层可能都在调同一个模型，但上下文的处理策略完全不同，最终输出的质量自然天差地别。你选工具，选的不是模型，选的是上下文工程的实现水平。

提示词工程和上下文工程解决了”让模型说对话”的问题。但模型说得再对，它还是只能聊天。它没法帮你真正干活。

要让模型真正执行任务——读文件、写代码、跑测试、修报错——就需要给它配上执行能力：Bash 沙箱、文件系统、MCP 工具调用……这些构成了执行层。

有了执行层，模型就能一边思考、一边行动，执行结果再反馈回上下文，驱动下一轮推理。这个循环就是 ReAct，这个能帮你执行任务的程序，就是 AI Agent。

Agent 的本质，是一个 for 循环。但循环一长，问题就来了：上下文膨胀、目标漂移、越跑越偏，甚至陷入无效死循环。

所以 Harness Engineering 在执行层之外，还需要三层东西：

记忆层——让 Agent 知道自己做了什么、哪里出错了、哪些不能做、还有哪些问题没解决。不是简单塞一堆文档，而是让 Agent 在长时任务中保持一致性。
反馈层——让 Agent 出错之后能自动恢复。测试报错、Linter 飘红，Agent 下一轮自动修复，而不是卡住等你来救。
编排层——把大任务拆成有明确标准的子步骤，按规划驱动 Agent 分步执行，而不是在一个没有终点的循环里空转。

编排层让 Agent 跑得准，反馈层让 Agent 跑得稳，记忆层让 Agent 知道自己是谁、在哪、要往哪去。

说白了，Harness Engineering 就是给 LLM 这个强大的引擎套上一层工程化的约束。

LLM 很强，但它本质上是个”猜下一个词”的机器。你要让它真正帮你干活，就需要给它套上约束——让它知道什么该做、什么不能做、出问题了怎么办、做到哪一步了。

这不是在削弱模型的能力，而是在引导它，让它把能力用在正确的地方。就像骑师不需要让马跑得更快，只需要用缰绳引导马走对方向。

读了不少关于 Harness Engineering 的讨论和实践，有些观点让我重新理解了这件事。

Harness 不是让模型变强，而是引导模型把能力用在正确的地方。LLM 很强，但它本质上是个”猜下一个词”的机器。你要让它帮你干活，就得给它套上约束——知道什么该做、什么不能做，出了问题怎么办、做到哪一步了。

在这个基础上，我理解 Harness 的核心就三件事：

知道了这些，就知道该往哪使劲了。

三层工程各自解决的问题：

这三层，是 AI 编程从”能用”到”好用”到”真正干活”的完整路径。别停在第一层。

#ai #engineering #llm #agent

提示词工程、上下文工程、驾驭工程：AI 编程从"能用"到"真干活"的三层路径

https://darven-cs.github.io/2026/04/27/2026-04-28-提示词工程-上下文工程-驾驭工程-AI-编程从能用到的三层路径/

作者

Darven

发布于

2026年4月28日

许可协议