最近,行业对 agent 的讨论,正在从 “prompt engineering” 转向 “harness engineering”。
OpenAI 在官方文章 Harness Engineering 中强调,随着模型能力持续提升,决定 agent 上限的往往不再只是单次 prompt,而是模型外部那层完整的工作台。Anthropic 在 Building Effective Agents 中强调,真正有效的 agent 往往来自简单、可组合、可持续优化的模式;Claude Code 的官方设计里,也把长期指令、Skills、Subagents、MCP 看作 agent 的执行外壳。LangChain 则持续把 middleware 与 context engineering 当成 agent loop 的关键控制层。
XpertAI 3.9.0 的重点,正是把这套思路产品化为一套更完整的智能体工作台:ClawXpert + Skills。
为什么 Prompt 已经不够了
当智能体开始承担更真实的工作时,团队很快会发现,一个 prompt 很难覆盖所有需求。
你可能希望它:
- 长期记住自己的角色和边界。
- 记住某个用户或团队的偏好。
- 在不同任务里调用不同的方法论和最佳实践。
- 有些能力默认开放,有些能力只在特定场景可用。
- 不只在聊天中回答,还能被触发、被安排、被持续执行。
这时候,问题就不再是“这一轮对话该怎么写 prompt”,而是“这个智能体应该拥有什么样的工作台”。
这就是 harness engineering 的核心。
什么是 Harness Engineering
如果说 prompt engineering 是打磨一句话,那么 harness engineering 更像是在设计一个完整的操作系统。
它关注的不是模型单轮输出,而是模型周围那一整套可持续运行的结构,例如:
换句话说,harness engineering 不是让模型“更会说”,而是让智能体“更会工作”。
XpertAI 3.9.0 做的,就是把这套结构真正落到产品里。
3.9.0 的核心变化:ClawXpert 成为长期可用的智能体外壳
ClawXpert 是 3.9.0 新增的专用 assistant shell。它让一个已发布的智能体,不再只是“发布后等待调用”的能力,而是拥有了一个长期可运营、可持续调校、可积累上下文的助手入口。
在这个入口里,团队可以围绕同一个智能体持续工作:
- 选择并绑定要长期使用的智能体。
- 统一维护它的角色设定、行为原则和用户偏好。
- 在同一入口里继续历史对话,而不是每次从零开始。
- 调整它当前使用的模型与能力边界。
- 让它从即时问答逐步走向计划执行与持续运行。
这意味着,智能体不再只是一个临时聊天窗口,而更像一个可以长期协作的数字工作台。
Skills:把团队经验沉淀成可复用能力
3.9.0 的另一条主线,是 Skills。
很多团队在做 agent 时都会遇到同一个问题:真正有价值的经验,往往不是“某一句提示词”,而是一套反复验证过的方法。
比如:
- 某类文档该如何拆解和处理。
- 某个任务应该按什么顺序完成。
- 某种分析、写作、研究、生成工作有哪些固定步骤。
- 某个工具该在什么条件下使用,输出应该长成什么样。
如果这些经验只存在聊天记录里,它们就很难复用,也很难沉淀成团队资产。
Skills 的价值,就在于把这些经验变成可安装、可浏览、可更新、可持续积累的能力模块。团队可以:
- 从技能仓库中安装需要的 skills。
- 把私有方法论整理成自己的技能包。
- 在工作区里持续维护这些技能内容。
- 让不同智能体共享同一套能力资产。
这让团队构建 agent 的方式,从“重复写 prompt”,转向“持续建设能力库”。
关键不只是“有技能”,而是“技能会在需要时被用起来”
更重要的是,3.9.0 并没有把 skills 停留在资料管理层。
在 XpertAI 的设计里,skills 不是摆在旁边的文档,而是会进入智能体工作流的一部分:
- 智能体会先知道自己有哪些可用技能。
- 当任务匹配时,再进一步读取对应技能的详细说明。
- 技能不是一次性塞满上下文,而是按需进入执行过程。
这种方式有两个直接好处:
- 一方面,智能体始终知道自己“能做什么”。
- 另一方面,它又不会因为无关信息过多而让上下文变得臃肿。
这也是当前行业里越来越重要的一种思路:不是把所有知识一次性压进 prompt,而是让智能体在执行过程中按需发现和使用能力。
同一套技能库,不同的人可以拥有不同的工作面
团队在真实使用中,还有一个非常实际的需求:同一个技能库,不一定适合所有人完全照单全收。
有人需要更完整的能力面,有人只需要更聚焦的工作面;有人在运营场景下需要更多自动化能力,有人在创作场景里只希望保留少量核心技能。
XpertAI 3.9.0 在这里做了很重要的一步:把“共享能力库”和“个性化可见面”拆开了。
你可以理解为:
- 团队共享同一个技能资产池。
- 但每个人都可以为自己的智能体工作台决定哪些能力保持开启。
- 同一个智能体,可以因用户、任务和场景不同,呈现不同的能力边界。
这让智能体更像一个可定制的工作环境,而不是所有人都被迫面对同一块复杂面板。
从“会回答”到“会执行”
当长期上下文、技能库、能力控制和计划机制被放在一起之后,智能体的使用方式会发生明显变化。
它不再只是在聊天里回答问题,而开始具备更连续的工作特征:
- 能持续保持稳定的人设和协作方式。
- 能在不同任务中复用成熟的方法。
- 能根据场景切换可见能力。
- 能被触发、被安排、被持续调用。
这正是 harness engineering 真正有价值的地方。
它让智能体从“一个会聊天的模型入口”,逐渐变成“一个可以长期运营的数字员工界面”。
一个更适合团队理解的搭建路径
如果用更直观的方式理解,XpertAI 3.9.0 带来的工作流大致是这样的:
- 先选定一个长期使用的智能体入口。
- 给它明确的角色、原则和用户偏好。
- 把团队常用的方法论整理成 skills。
- 为不同用户或场景决定哪些能力应该可见。
- 把它接入需要的触发和计划执行,让它开始承担持续任务。
- 随着团队使用不断补充和迭代能力库。
这条路径非常适合你后续配图,因为它本质上就是一个“从智能体配置到智能体运营”的演进过程。
这也是 XpertAI 对行业趋势的回应
今天大家越来越清楚,真正有价值的 agent 产品,不是只会在单轮对话里表现聪明,而是能够在长期协作中保持稳定、积累经验、按需调用能力,并逐步承担真实工作。
OpenAI、Anthropic、LangChain 都在推动这条方向,而 XpertAI 3.9.0 用 ClawXpert + Skills 给出了自己的产品化答案:
- 用长期入口承接持续协作。
- 用技能库承接团队经验。
- 用能力控制承接不同角色和场景。
- 用计划与触发承接持续执行。
这意味着,XpertAI 3.9.0 不只是增加了几个功能点,而是把智能体从“会回答”推进到了“可运营”。
立即体验
如果你已经在使用 XpertAI,3.9.0 很适合从下面几个动作开始:
- 为团队选定一个长期使用的
ClawXpert入口。 - 把角色设定、行为原则和用户偏好整理清楚。
- 安装第一批真正有复用价值的 skills。
- 根据不同用户和任务场景,调整能力可见面。
- 尝试把一部分固定工作交给计划执行或触发机制。
当这些能力组合在一起之后,你得到的就不再只是一个聊天机器人,而是一套真正可长期演进的智能体工作台。
XpertAI 3.9.0,不只是让智能体“更聪明”,而是让智能体开始拥有一套更完整的工作方式。