跳到主要内容

XpertAI 3.9.0 发布:从 Prompt Engineering 走向 Harness Engineering

· 阅读需 12 分钟
Tiven Wang

最近,行业对 agent 的讨论,正在从 “prompt engineering” 转向 “harness engineering”。

OpenAI 在官方文章 Harness Engineering 中强调,随着模型能力持续提升,决定 agent 上限的往往不再只是单次 prompt,而是模型外部那层完整的工作台。Anthropic 在 Building Effective Agents 中强调,真正有效的 agent 往往来自简单、可组合、可持续优化的模式;Claude Code 的官方设计里,也把长期指令、Skills、Subagents、MCP 看作 agent 的执行外壳。LangChain 则持续把 middleware 与 context engineering 当成 agent loop 的关键控制层。

XpertAI 3.9.0 的重点,正是把这套思路产品化为一套更完整的智能体工作台:ClawXpert + Skills

为什么 Prompt 已经不够了

当智能体开始承担更真实的工作时,团队很快会发现,一个 prompt 很难覆盖所有需求。

你可能希望它:

  • 长期记住自己的角色和边界。
  • 记住某个用户或团队的偏好。
  • 在不同任务里调用不同的方法论和最佳实践。
  • 有些能力默认开放,有些能力只在特定场景可用。
  • 不只在聊天中回答,还能被触发、被安排、被持续执行。

这时候,问题就不再是“这一轮对话该怎么写 prompt”,而是“这个智能体应该拥有什么样的工作台”。

这就是 harness engineering 的核心。

什么是 Harness Engineering

如果说 prompt engineering 是打磨一句话,那么 harness engineering 更像是在设计一个完整的操作系统。

它关注的不是模型单轮输出,而是模型周围那一整套可持续运行的结构,例如:

换句话说,harness engineering 不是让模型“更会说”,而是让智能体“更会工作”。

XpertAI 3.9.0 做的,就是把这套结构真正落到产品里。

3.9.0 的核心变化:ClawXpert 成为长期可用的智能体外壳

ClawXpert 是 3.9.0 新增的专用 assistant shell。它让一个已发布的智能体,不再只是“发布后等待调用”的能力,而是拥有了一个长期可运营、可持续调校、可积累上下文的助手入口

在这个入口里,团队可以围绕同一个智能体持续工作:

  • 选择并绑定要长期使用的智能体。
  • 统一维护它的角色设定、行为原则和用户偏好。
  • 在同一入口里继续历史对话,而不是每次从零开始。
  • 调整它当前使用的模型与能力边界。
  • 让它从即时问答逐步走向计划执行与持续运行。

这意味着,智能体不再只是一个临时聊天窗口,而更像一个可以长期协作的数字工作台。

Skills:把团队经验沉淀成可复用能力

3.9.0 的另一条主线,是 Skills

很多团队在做 agent 时都会遇到同一个问题:真正有价值的经验,往往不是“某一句提示词”,而是一套反复验证过的方法。

比如:

  • 某类文档该如何拆解和处理。
  • 某个任务应该按什么顺序完成。
  • 某种分析、写作、研究、生成工作有哪些固定步骤。
  • 某个工具该在什么条件下使用,输出应该长成什么样。

如果这些经验只存在聊天记录里,它们就很难复用,也很难沉淀成团队资产。

Skills 的价值,就在于把这些经验变成可安装、可浏览、可更新、可持续积累的能力模块。团队可以:

  • 从技能仓库中安装需要的 skills。
  • 把私有方法论整理成自己的技能包。
  • 在工作区里持续维护这些技能内容。
  • 让不同智能体共享同一套能力资产。

这让团队构建 agent 的方式,从“重复写 prompt”,转向“持续建设能力库”。

关键不只是“有技能”,而是“技能会在需要时被用起来”

更重要的是,3.9.0 并没有把 skills 停留在资料管理层。

在 XpertAI 的设计里,skills 不是摆在旁边的文档,而是会进入智能体工作流的一部分:

  • 智能体会先知道自己有哪些可用技能。
  • 当任务匹配时,再进一步读取对应技能的详细说明。
  • 技能不是一次性塞满上下文,而是按需进入执行过程。

这种方式有两个直接好处:

  • 一方面,智能体始终知道自己“能做什么”。
  • 另一方面,它又不会因为无关信息过多而让上下文变得臃肿。

这也是当前行业里越来越重要的一种思路:不是把所有知识一次性压进 prompt,而是让智能体在执行过程中按需发现和使用能力。

同一套技能库,不同的人可以拥有不同的工作面

团队在真实使用中,还有一个非常实际的需求:同一个技能库,不一定适合所有人完全照单全收。

有人需要更完整的能力面,有人只需要更聚焦的工作面;有人在运营场景下需要更多自动化能力,有人在创作场景里只希望保留少量核心技能。

XpertAI 3.9.0 在这里做了很重要的一步:把“共享能力库”和“个性化可见面”拆开了。

你可以理解为:

  • 团队共享同一个技能资产池。
  • 但每个人都可以为自己的智能体工作台决定哪些能力保持开启。
  • 同一个智能体,可以因用户、任务和场景不同,呈现不同的能力边界。

这让智能体更像一个可定制的工作环境,而不是所有人都被迫面对同一块复杂面板。

从“会回答”到“会执行”

当长期上下文、技能库、能力控制和计划机制被放在一起之后,智能体的使用方式会发生明显变化。

它不再只是在聊天里回答问题,而开始具备更连续的工作特征:

  • 能持续保持稳定的人设和协作方式。
  • 能在不同任务中复用成熟的方法。
  • 能根据场景切换可见能力。
  • 能被触发、被安排、被持续调用。

这正是 harness engineering 真正有价值的地方。

它让智能体从“一个会聊天的模型入口”,逐渐变成“一个可以长期运营的数字员工界面”。

一个更适合团队理解的搭建路径

如果用更直观的方式理解,XpertAI 3.9.0 带来的工作流大致是这样的:

  1. 先选定一个长期使用的智能体入口。
  2. 给它明确的角色、原则和用户偏好。
  3. 把团队常用的方法论整理成 skills。
  4. 为不同用户或场景决定哪些能力应该可见。
  5. 把它接入需要的触发计划执行,让它开始承担持续任务。
  6. 随着团队使用不断补充和迭代能力库。

这条路径非常适合你后续配图,因为它本质上就是一个“从智能体配置到智能体运营”的演进过程。

这也是 XpertAI 对行业趋势的回应

今天大家越来越清楚,真正有价值的 agent 产品,不是只会在单轮对话里表现聪明,而是能够在长期协作中保持稳定、积累经验、按需调用能力,并逐步承担真实工作。

OpenAI、Anthropic、LangChain 都在推动这条方向,而 XpertAI 3.9.0 用 ClawXpert + Skills 给出了自己的产品化答案:

  • 用长期入口承接持续协作。
  • 用技能库承接团队经验。
  • 用能力控制承接不同角色和场景。
  • 用计划与触发承接持续执行。

这意味着,XpertAI 3.9.0 不只是增加了几个功能点,而是把智能体从“会回答”推进到了“可运营”。

立即体验

如果你已经在使用 XpertAI,3.9.0 很适合从下面几个动作开始:

  • 为团队选定一个长期使用的 ClawXpert 入口。
  • 把角色设定、行为原则和用户偏好整理清楚。
  • 安装第一批真正有复用价值的 skills
  • 根据不同用户和任务场景,调整能力可见面。
  • 尝试把一部分固定工作交给计划执行触发机制

当这些能力组合在一起之后,你得到的就不再只是一个聊天机器人,而是一套真正可长期演进的智能体工作台。


XpertAI 3.9.0,不只是让智能体“更聪明”,而是让智能体开始拥有一套更完整的工作方式。