XpertAI 3.9.0 发布：从 Prompt Engineering 走向 Harness Engineering

最近，行业对 agent 的讨论，正在从 “prompt engineering” 转向 “harness engineering”。

OpenAI 在官方文章 Harness Engineering 中强调，随着模型能力持续提升，决定 agent 上限的往往不再只是单次 prompt，而是模型外部那层完整的工作台。Anthropic 在 Building Effective Agents 中强调，真正有效的 agent 往往来自简单、可组合、可持续优化的模式；Claude Code 的官方设计里，也把长期指令、Skills、Subagents、MCP 看作 agent 的执行外壳。LangChain 则持续把 middleware 与 context engineering 当成 agent loop 的关键控制层。

XpertAI 3.9.0 的重点，正是把这套思路产品化为一套更完整的智能体工作台：ClawXpert + Skills。

为什么 Prompt 已经不够了

当智能体开始承担更真实的工作时，团队很快会发现，一个 prompt 很难覆盖所有需求。

你可能希望它：

长期记住自己的角色和边界。
记住某个用户或团队的偏好。
在不同任务里调用不同的方法论和最佳实践。
有些能力默认开放，有些能力只在特定场景可用。
不只在聊天中回答，还能被触发、被安排、被持续执行。

这时候，问题就不再是“这一轮对话该怎么写 prompt”，而是“这个智能体应该拥有什么样的工作台”。

这就是 harness engineering 的核心。

什么是 Harness Engineering

如果说 prompt engineering 是打磨一句话，那么 harness engineering 更像是在设计一个完整的操作系统。

它关注的不是模型单轮输出，而是模型周围那一整套可持续运行的结构，例如：

身份与行为规则。
用户画像与长期记忆。
技能库与可复用方法。
工具和能力的可见范围，以及智能体中间件这样的控制层。
文件、环境与执行空间。
触发器、计划与持续动作。

换句话说，harness engineering 不是让模型“更会说”，而是让智能体“更会工作”。

XpertAI 3.9.0 做的，就是把这套结构真正落到产品里。

3.9.0 的核心变化：ClawXpert 成为长期可用的智能体外壳

ClawXpert 是 3.9.0 新增的专用 assistant shell。它让一个已发布的智能体，不再只是“发布后等待调用”的能力，而是拥有了一个长期可运营、可持续调校、可积累上下文的助手入口。

在这个入口里，团队可以围绕同一个智能体持续工作：

选择并绑定要长期使用的智能体。
统一维护它的角色设定、行为原则和用户偏好。
在同一入口里继续历史对话，而不是每次从零开始。
调整它当前使用的模型与能力边界。
让它从即时问答逐步走向计划执行与持续运行。

这意味着，智能体不再只是一个临时聊天窗口，而更像一个可以长期协作的数字工作台。

Skills：把团队经验沉淀成可复用能力

3.9.0 的另一条主线，是 Skills。

很多团队在做 agent 时都会遇到同一个问题：真正有价值的经验，往往不是“某一句提示词”，而是一套反复验证过的方法。

比如：

某类文档该如何拆解和处理。
某个任务应该按什么顺序完成。
某种分析、写作、研究、生成工作有哪些固定步骤。
某个工具该在什么条件下使用，输出应该长成什么样。

如果这些经验只存在聊天记录里，它们就很难复用，也很难沉淀成团队资产。

Skills 的价值，就在于把这些经验变成可安装、可浏览、可更新、可持续积累的能力模块。团队可以：

从技能仓库中安装需要的 skills。
把私有方法论整理成自己的技能包。
在工作区里持续维护这些技能内容。
让不同智能体共享同一套能力资产。

这让团队构建 agent 的方式，从“重复写 prompt”，转向“持续建设能力库”。

关键不只是“有技能”，而是“技能会在需要时被用起来”

更重要的是，3.9.0 并没有把 skills 停留在资料管理层。

在 XpertAI 的设计里，skills 不是摆在旁边的文档，而是会进入智能体工作流的一部分：

智能体会先知道自己有哪些可用技能。
当任务匹配时，再进一步读取对应技能的详细说明。
技能不是一次性塞满上下文，而是按需进入执行过程。

这种方式有两个直接好处：

一方面，智能体始终知道自己“能做什么”。
另一方面，它又不会因为无关信息过多而让上下文变得臃肿。

这也是当前行业里越来越重要的一种思路：不是把所有知识一次性压进 prompt，而是让智能体在执行过程中按需发现和使用能力。

同一套技能库，不同的人可以拥有不同的工作面

团队在真实使用中，还有一个非常实际的需求：同一个技能库，不一定适合所有人完全照单全收。

有人需要更完整的能力面，有人只需要更聚焦的工作面；有人在运营场景下需要更多自动化能力，有人在创作场景里只希望保留少量核心技能。

XpertAI 3.9.0 在这里做了很重要的一步：把“共享能力库”和“个性化可见面”拆开了。

你可以理解为：

团队共享同一个技能资产池。
但每个人都可以为自己的智能体工作台决定哪些能力保持开启。
同一个智能体，可以因用户、任务和场景不同，呈现不同的能力边界。

这让智能体更像一个可定制的工作环境，而不是所有人都被迫面对同一块复杂面板。

从“会回答”到“会执行”

当长期上下文、技能库、能力控制和计划机制被放在一起之后，智能体的使用方式会发生明显变化。

它不再只是在聊天里回答问题，而开始具备更连续的工作特征：

能持续保持稳定的人设和协作方式。
能在不同任务中复用成熟的方法。
能根据场景切换可见能力。
能被触发、被安排、被持续调用。

这正是 harness engineering 真正有价值的地方。

它让智能体从“一个会聊天的模型入口”，逐渐变成“一个可以长期运营的数字员工界面”。

一个更适合团队理解的搭建路径

如果用更直观的方式理解，XpertAI 3.9.0 带来的工作流大致是这样的：

先选定一个长期使用的智能体入口。
给它明确的角色、原则和用户偏好。
把团队常用的方法论整理成 skills。
为不同用户或场景决定哪些能力应该可见。
把它接入需要的触发和计划执行，让它开始承担持续任务。
随着团队使用不断补充和迭代能力库。

这条路径非常适合你后续配图，因为它本质上就是一个“从智能体配置到智能体运营”的演进过程。

这也是 XpertAI 对行业趋势的回应

今天大家越来越清楚，真正有价值的 agent 产品，不是只会在单轮对话里表现聪明，而是能够在长期协作中保持稳定、积累经验、按需调用能力，并逐步承担真实工作。

OpenAI、Anthropic、LangChain 都在推动这条方向，而 XpertAI 3.9.0 用 ClawXpert + Skills 给出了自己的产品化答案：

用长期入口承接持续协作。
用技能库承接团队经验。
用能力控制承接不同角色和场景。
用计划与触发承接持续执行。

这意味着，XpertAI 3.9.0 不只是增加了几个功能点，而是把智能体从“会回答”推进到了“可运营”。

立即体验

如果你已经在使用 XpertAI，3.9.0 很适合从下面几个动作开始：

为团队选定一个长期使用的 ClawXpert 入口。
把角色设定、行为原则和用户偏好整理清楚。
安装第一批真正有复用价值的 skills。
根据不同用户和任务场景，调整能力可见面。
尝试把一部分固定工作交给计划执行或触发机制。

当这些能力组合在一起之后，你得到的就不再只是一个聊天机器人，而是一套真正可长期演进的智能体工作台。

XpertAI 3.9.0，不只是让智能体“更聪明”，而是让智能体开始拥有一套更完整的工作方式。

为什么 Prompt 已经不够了​

什么是 Harness Engineering​

3.9.0 的核心变化：ClawXpert 成为长期可用的智能体外壳​

Skills：把团队经验沉淀成可复用能力​

关键不只是“有技能”，而是“技能会在需要时被用起来”​

同一套技能库，不同的人可以拥有不同的工作面​

从“会回答”到“会执行”​

一个更适合团队理解的搭建路径​

这也是 XpertAI 对行业趋势的回应​

立即体验​