· · ·

世界杯精彩瞬间

世界杯精彩瞬间

世界杯(中国) Claude Code团队成员亲述: 动态使命流该何如用

发布日期:2026-06-05 14:34 来源:未知 作者:admin 浏览次数:

机器之心剪辑部

上周,Claude Code 发布了一个新才气:动态使命流。

该功能允许 Claude 根据具体任务即时编写定制化实施框架,结合多个子 Agent 并应用命,经管大限度、高并行、造反性任务中的系统性失效问题。

近日,Anthropic 工程师 Thariq 发了篇长文,分享了他率先的使命流教诲和心得。

咱们对此进行了全文整理译述。

在久了技巧细节之前,Thariq 先提供了一些示例指示,来让咱们理解使命流的后劲:

「这个测试可能每 50 次初始失败一次。诞生一个使命流,近似初始测试,变成假定,并在使命树中对其进行造反性考据 / 方向:不断尝试,直到有一个假定奏效。」

「使用使命流,清雅我最近的 50 次会话,挖掘我反复犯的无理,并将这些近似性问题生成 CLAUDE.md 礼貌。」

「用使命流翻查往时六个月 Slack 的 #incidents 频说念,找出反复出现、但还莫得东说念主提交工单的根蒂原因。」

「拿我的贸易操办,初始一个使命流,让不同的 Agent 从投资者、客户和竞争敌手的角度进行拆解。」

「这里有一个包含 80 份简历的文献夹,用使命流对其进行名次,选出后端岗亭的最好候选,并对前十名进行复核。使用 AskUserQuestion 器具进行口试评分。」

「我需要给这个 CLI 器具取名。使用使命流生成多个选项,并进行淘汰赛选出前三个最好有缠绵。」

「使用使命流,将咱们的 User 模子重定名为 Account。」

「审查我的博客著作草稿,使用使命流考据每一项技巧声明是否安妥代码库,确保不发布无理信息。」

动态使命流怎样使命

动态使命流实施一个包含特殊函数的 JavaScript 文献,这些函数匡助生成和结合子 Agent。

同期,动态使命流还包括圭臬 JavaScript 功能,如 JSON、Math 和 Array,用于处理数据。

动态使命流不错决定一个 Agent 使用的模子类型,以及子 Agent 是否在零丁的使命树中初始,从而让 Claude 取舍所需的智能水善良阻隔花式。

若是使命流中断,例如被用户操作或末端退出,归附会话时,使命流不错从中断点连续实施。

为何使用动态使命流

当咱们使用默许 Claude Code 框架实施任务时,它需要在合并个陡立文窗口中同期进行操办和实施。对于很多编程任务,这极度有用,但在万古辰初始、大限度并行或高度结构化的造反任务中,有时会出现问题。

原因在于,Claude 在单个陡立文窗口中处理复杂任务时辰越长,就越容易出现以下几类失败模式:

智能体懒惰(Agentic laziness):Claude 在处理复杂多法子任务时可能提前住手,声称任务完成,例如只处理 50 条安全审查中的 20 条。

自我偏好偏差(Self-preferential bias):Claude 倾向于偏向我方的驱散或发现,尤其在需要考据或评估时。

方向漂移(Goal drift):在多轮操作中,任务方向渐渐偏离,非常是在压缩总结之后,细节如角落案例或「扼制作念 X」的拘谨可能丢失。

创建使命流不错通过为不同方向分派零丁陡立文窗口的 Claude 实例来幸免这些问题,每个实例专注、阻隔任务方向。

动态与静态使命流的区别

你可能之前使用 Claude Agent SDK 或 claude -p 创建过静态使命流,以结合多个 Claude Code 实例。

静态使命流需兼顾扫数顶点情况,因此无为更通用。而使用 Claude Opus 4.8 的动态使命流,Claude 当今有时生成针对你的特定用例定制的智能框架。

动态使命流的常用模式

你不错胜仗让 Claude 生成动态使命流,或者使用触发词「ultracode」确保 Claude Code 创建使命流。

理解动态使命流的常用模式,有助于判断何时使用以及怎样通过指示诱骗 Claude:

分类并实施(Classify-and-act):使用分类器 Agent 决定任务类型,然后根据任务路由到不同 Agent 或举止,也可在临了使用分类器判断输出。

分发并汇总(Fan-out-and-synthesize):将任务拆分红多个小法子,每个法子由一个 Agent 处理,然后汇总驱散。非常安妥多半小法子或每步需要零丁陡立文的情况。汇总法子会恭候扫数分发 Agent 完成,然后将结构化输出合并。

造反性考据(Adversarial verification):每个子 Agent 的输出都由另一个 Agent 对照评判圭臬进行造反性考据。

生成并筛选(Generate-and-filter):生成多个思法,然后根据评判圭臬筛选,去重,只复返高质地且考据过的思法。

皇冠app(中国)官网入口

竞赛(Tournament):让多个 Agent 以不同花式实施疏导任务,再通过评判 Agent 两两比较驱散,选出最优。

轮回直到完成(Loop until done):对于使命量未知的任务,轮回生成 Agent,直到中意住手条件(无新发现或日记中无更多无理),而非固定轮次。

用例

移动与重构

Bun 从 Zig 重写到 Rust,即是用 workflows 完成的。

关键是把任务拆成一系列不错迟缓处理的小单位,比如调用点、失败测试、模块等。每一个建立都在零丁的 worktree 里派出一个子 Agent 去完成;之后再让另一个 Agent 作念造反式审查,证明没问题后再合并。

若是但愿尽可能并行,又不思把本机资源打满,不错明确告诉 Agent 不要初始资源阔绰很高的号召。

深度商议

咱们在 Claude Code 里发布了一个深度商议 skill(/deep-research),它使用的即是动态 workflows。

具体来说,它会并行伸开网页搜索,握取贵府开首,对其中的说法作念造反式考据,临了整合成一份带援用的商议答复。

不外,这类商议并不单限于网页搜索。比如,你也不错让 Claude 从 Slack 的陡立文里整理一份气象答复,或者让它久了浏览代码库,商议某个功能到底是何如兑现的。

深度考据

另一方面,若是你有一份答复,并但愿一一核查其中援用的每一项事实阐扬过头开首,你不错构建一套使命流:先由一个智能体负责识别出扫数的事实阐扬,随后派生出一个子智能体,世界杯官网线上平台对每一项阐扬进行详备的核查。此外,你还不错引入一个考据智能体,专诚对负责溯源的子智能体进行复核,以确保其所援用的开首具备高质地。

排序

你可能会有一批条款,思按某种定性的圭臬来排序,而这个圭臬又是 Claude Code 比较擅长判断的。比如,把援助工单按 bug 严重进度排序。

但若是你思在一个 prompt 里一次性处理 1000 多行,质地很容易下跌,何况陡立文也放不下。更好的作念法是跑一场「锦标赛」:搭建一条由两两比较 Agent 构成的活水线。比拟胜仗打完全分,两两比较无为更可靠。

也不错先并行分桶排序,再把驱散合并。每一次比较都交给一个零丁 Agent 完成,详情味的轮回负责珍摄扫数这个词比赛括号,竟然留在陡立文里的,唯有刻下正在实施的限定。

缅思与礼貌恪守

若是你发现存一组礼貌,即便写进 CLAUDE.md,Claude 仍然常常漏掉或实施不好,则不错专诚作念一个使命流:把这些礼貌列出来,让考据 Agent 逐条查抄。每条礼貌对应一个考据 Agent。

同期,再创建一个带有怀疑者视角的子 Agent,专诚复核这些礼貌是否合理、是否真的对皆方向,这么不错减少过多误报。

反过来也建立:你不错从最近的会话和代码审查成见里,挖出那些你反复矫正的问题;再让多个 Agent 并行归类整理;然后对每条候选礼貌作念造反式考据,比如追问:这条礼貌其时真的能幸免一个竟然无理吗?临了,把通过考据的礼貌再索取回 CLAUDE.md。

根因访问

调试最有用的设施,无为是先建议几个互相零丁的假定,再一一考据。但若是只依赖一个陡立文窗口,Claude 很容易堕入某种「自我偏好」:越看越信服我方率先的判断。

使命流不错从结构上幸免这少量。它不错让多个 Agent 基于相互阻隔的字据诀别建议假定。比如,一个 Agent 只看日记,一个只看文献,一个只看数据。随后,每个假定再交给一组考据者和反驳者来磨真金不怕火。

这种设施并不单适用于代码。销售场景也不错用,比如分析 3 月销售额为什么下滑;数据工程也不错用,比如排查某条数据管说念为什么失败。任何需要作念复盘、找根因的问题,都不错用类似的使命流来处理。

Triaging at scale

大限度工单分拣

每个团队都濒临着援助工单部队、Bug 答复或其他积压任务,这些任务常常无法仅凭东说念主工完全处理。分流使命流(Triage workflow)有时对每一个待管事项进行分类,与已跟踪的条款进行去重比对,并摄取相应的作为。这些作为可能包括尝试胜仗建立问题,或者将其升级转交给东说念主工用户处理。

在分流使命流中,「阻隔」(Quarantine)是一种极度实用的模式。其中枢作念法是:扼制那些负责读取非受信环球本色的智能体实施高权限操作;相悖,这些高权限操作将交由专诚负责基于信息摄取作为的智能体来实施。将分流使命流与 /loop 指示辘集使用,即可让 Claude 持续无间地自动实施此类任务。

探索与试吃判断

在探索针对某还是管有缠绵的不同兑现旅途时,使命流显得尤为有用 —— 非常是当任务波及主不雅「试吃」判断(如假想或定名使命)且需要依据一套既定圭臬(Rubric)进行评估时。

不妨尝试让 Claude 探索并生成一系列潜在的经管有缠绵,随后指派一个「评审智能体」,并为其提供一套明确的评估圭臬,用以界定何为「优质」的经管有缠绵。当该评审智能体判定某有缠绵已完全安妥既定圭臬时,该任务即宣告完成。此外,还不错依据这套评估圭臬,通过「锦标赛」式的比拼机制对种种经管有缠绵进行排序或最终筛选。

评估

你不错针对特定任务初始轻量级的评估经由:起初在零丁的「使命树」(Worktree)中养殖出一组智能体来实施任务;随后再养殖出一组「对比智能体」,依据既定的评估圭臬对前述智能体生成的具体输出驱散进行比对与评分。例如而言,你不错利用这一机制,依据特定的评估圭臬,对你所创建的某项 Skill 进行评估,并在此基础上加以迭代优化。

模子与智能路由

你不错创建一个专诚针对你的任务进行调优的「分类智能体」,由其负责决接应调用哪一个基础模子来实施任务。当你的任务波及多半的器具调用时,这一机制尤为实用 —— 通过在认竟然施任务前进行事前分析与调研,该分类智能体有时精确识别出最安妥刻下任务的基础模子。

例如来说,针对「讲解认证模块(Auth module)的使命旨趣」这一任务,其最好的基础模子取舍并非一成不变,而是取决于该认证模块内包含的文献数目以及扫数这个词代码库的合座结构形态。此时,分类智能体便可承担起这项事前分析的职责,并依据对任务预期复杂度的判断,将任务智能路由至 Sonnet 或 Opus 等不同的基础模子进行处理。

何时不宜使用动态使命流

「使命流」是一项相对较新的功能。尽管在很多应用场景下,它能带来一本万利的权贵成效,但并非每一项任务都必须依赖使命流;若滥用使命流,反而可能导致阔绰远超预期的 Token 资源。

最好的执行计谋是发达创意,以一种前所未有的花式生动运用使命流,从而充分挖掘 Claude Code 的潜能。对于通例的编程任务,不妨先自问一句:这项任务真的有必要参加特殊的狡计资源来初始使命流吗?例如,大多数传统的编码任务并不需要由五名审阅者构成的评审小组。

构建动态使命流的技巧

指示词假想

针对动态使命流,若选拔咱们上文胪陈的特定技巧来编写看管的指示词,常常能取得最好成果。

使命流并非仅适用于大型任务。你也不错通过指示词指示,让模子实施一种「快速使命流」。比如你不错快速构建一个针对特定假定进行「造反性审查」的使命流。

辘集使用 /goal 与 /loop 指示。

当你需要实施可近似的使命流(例如任务分流、贵府调研或信息核实)时,建议搭配使用 /loop 指示以兑现周期性实施,并辘集 /goal 指示来设定明确的任务完成硬性主见。

Token 使用预算

你不错为动态使命流设定明确的 Token 使用预算,以此驱散单项任务所阔绰的 Token 数目。你不错在指示词中胜仗指定预算额度,例如输入:「use 10k tokens」(使用 10k Token),系统便会自动设定相应的上限。

保存与分享动态使命流

你不错通过在使命流菜单中按下「s」键来保存刻下的使命流。你不错将这些使命流文献存档至~/.claude/workflows 目次下,也不错将其打包为「妙技」(Skill)的体式进行分发与分享。

若要通过妙技(Skill)来分享这些文献,请将你的 JavaScript 使命流文献放入该妙技对应的文献夹中,并在 SKILL.MD 文献中援用它们。为了得回更大的生动性,你可能但愿指示 Claude 将该妙技中的使命流视为「模板」,而非必须一字一句实施的剧本。

使命流是一种有助于推广 Claude Code 的全新花式。民众应该将其视为一个起初 —— 对于怎样充分发达其效率世界杯(中国),仍有很多值得探索之处。期待听到你的发现。