提示词工程、上下文工程、驾驭工程:AI 编程从"能用"到"真干活"的三层路径

你以为学会提示词就够了

大多数人接触 AI 编程的第一课,都是提示词工程。逻辑很直接:大模型的本质是在预测”下一个词最可能是什么”,它只是在猜你想要什么。你给的指令越清晰,它猜得越准。

于是大家开始研究怎么写提示词——加角色设定、加背景、加输出格式、加限制条件……这没有错。提示词工程确实有用,它解决的是大模型无引导、乱说话的问题。

但我在实战中很快就撞到了天花板。提示词写得再好,只要项目稍微复杂一点,AI 给的结果就开始飘。不是因为提示词写得不够好,而是因为模型知道的信息不够

你丢给它一个任务,它不知道你的项目背景,不知道你的技术栈,不知道你上次做了什么决策、为什么这么做。它每次都像一个刚入职的新员工,从零开始理解你的世界。

提示词解决的是”怎么说话”的问题,但没解决”说什么”的问题。

上下文工程:真正拉开差距的地方

这就是上下文工程要做的事。发给大模型的所有信息,统称为上下文。提示词只是其中一部分。项目文档、历史对话、当前代码、报错信息……这些打包在一起,才是完整的上下文。

道理很简单:给的信息越精准,模型回答越准。但问题来了——大模型一次能处理的上下文有上限,叫上下文窗口。信息塞多了,就得压缩、就得丢弃。丢着丢着,关键信息没了,模型开始记不住,前后回答开始矛盾。这叫上下文腐化

做过稍微长一点的 AI 编程任务的人,应该都遇到过这个感觉:越聊越跑偏,越改越乱。

上下文工程要解决的,就是在有限的窗口里,把最相关的信息在最合适的时机塞进去。具体怎么做?三步:召回、压缩、组装。找到最相关的信息,把它压缩到合适的体量,再按照对模型理解最有利的顺序组装好,然后发出去。

这也是为什么同一个模型,不同 AI 工具效果差这么多。Cursor、Claude Code、Windsurf,底层可能都在调同一个模型,但上下文的处理策略完全不同,最终输出的质量自然天差地别。你选工具,选的不是模型,选的是上下文工程的实现水平

驾驭工程:从”会聊天”到”真干活”

提示词工程和上下文工程解决了”让模型说对话”的问题。但模型说得再对,它还是只能聊天。它没法帮你真正干活。

要让模型真正执行任务——读文件、写代码、跑测试、修报错——就需要给它配上执行能力:Bash 沙箱、文件系统、MCP 工具调用……这些构成了执行层

有了执行层,模型就能一边思考、一边行动,执行结果再反馈回上下文,驱动下一轮推理。这个循环就是 ReAct,这个能帮你执行任务的程序,就是 AI Agent。

Agent 的本质,是一个 for 循环。但循环一长,问题就来了:上下文膨胀、目标漂移、越跑越偏,甚至陷入无效死循环。

所以 Harness Engineering 在执行层之外,还需要三层东西:

  • 记忆层——让 Agent 知道自己做了什么、哪里出错了、哪些不能做、还有哪些问题没解决。不是简单塞一堆文档,而是让 Agent 在长时任务中保持一致性。
  • 反馈层——让 Agent 出错之后能自动恢复。测试报错、Linter 飘红,Agent 下一轮自动修复,而不是卡住等你来救。
  • 编排层——把大任务拆成有明确标准的子步骤,按规划驱动 Agent 分步执行,而不是在一个没有终点的循环里空转。

编排层让 Agent 跑得准,反馈层让 Agent 跑得稳,记忆层让 Agent 知道自己是谁、在哪、要往哪去。

Harness 到底是什么

说白了,Harness Engineering 就是给 LLM 这个强大的引擎套上一层工程化的约束

LLM 很强,但它本质上是个”猜下一个词”的机器。你要让它真正帮你干活,就需要给它套上约束——让它知道什么该做、什么不能做、出问题了怎么办、做到哪一步了。

这不是在削弱模型的能力,而是在引导它,让它把能力用在正确的地方。就像骑师不需要让马跑得更快,只需要用缰绳引导马走对方向。

学到了什么

读了不少关于 Harness Engineering 的讨论和实践,有些观点让我重新理解了这件事。

Harness 不是让模型变强,而是引导模型把能力用在正确的地方。LLM 很强,但它本质上是个”猜下一个词”的机器。你要让它帮你干活,就得给它套上约束——知道什么该做、什么不能做,出了问题怎么办、做到哪一步了。

在这个基础上,我理解 Harness 的核心就三件事:

  • 编排:让 Agent 跑得准。大任务拆成明确标准的子步骤,按规划一步步走,不是让 Agent 在没有终点的循环里空转。
  • 反馈:让 Agent 跑得稳。测试报错、Lint 飘红,Agent 下一轮自动修复,而不是卡住等你来救。
  • 记忆:让 Agent 知道自己是谁、在哪、要往哪去。知道自己做了什么、哪出错了、什么不能做、还有什么问题没解决。

知道了这些,就知道该往哪使劲了。

总结

三层工程各自解决的问题:

层级 解决的问题
提示词工程 让大模型听懂你说的话,按你要的格式输出
上下文工程 给大模型注入精准有效的信息,减少腐化
驾驭工程 让大模型持续按规范执行任务,真正交付结果

这三层,是 AI 编程从”能用”到”好用”到”真正干活”的完整路径。别停在第一层。


提示词工程、上下文工程、驾驭工程:AI 编程从"能用"到"真干活"的三层路径
https://darven-cs.github.io/2026/04/27/2026-04-28-提示词工程-上下文工程-驾驭工程-AI-编程从能用到的三层路径/
作者
Darven
发布于
2026年4月28日
许可协议