大家真正在跑的 15 个循环:可以今晚直接粘贴的命令清单

上一篇聊了"循环工程"到底是什么,这一篇回答下一个问题:大家实际在跑哪些循环?这里整理了从 X、TikTok、Reddit、YouTube、GitHub 上扒出来的 15 个循环,每一个都附上可以直接粘贴的命令,并讲清 /goal、/loop、/schedule 这三个命令的区别——几乎所有人都会在这里搞混。

阅读时长: 10 分钟
共 4528字
作者: longlikun

上一篇 我聊了「循环工程」到底是什么——别再亲自给智能体写提示词,去设计那个替你写提示词的系统。这一篇回答下一个问题:大家实际在跑哪些循环?

我去 X、TikTok、Reddit、YouTube、GitHub 上扒了一个月的内容,挑出了 15 个最值得抄的。每一个都注明了出处,能查到真实互动数据的就附上,没有现成命令的我重写成了你今晚就能粘贴的样子。但在开始之前,得先把一个几乎所有人都搞混的区别讲清楚。

先搞清三个命令(这里是重灾区)

我见过最干净的说法来自 TikTok 上的 inyourhandmedia:

  • 目标(Goal):一直干,直到结果达成。
  • 循环(Loop):我在的时候,不停重复一项任务。
  • 例程(Routine):我不在的时候,继续干。

翻译成实际命令就是:

/goal <condition> 会一直跑,直到某个可验证的条件为真,然后停下。每跑完一轮,会有一个独立的快速模型来判断你是不是真的完成了。这就是「修到测试通过为止」要用的那个,也是两个工具唯一都有的命令——Claude Code 在 v2.1.139 里发布,Codex 在 CLI v0.128.0 里也上了自己的版本,带 set / pause / resume / clear 这一套控制。

/loop <interval> <prompt> 在会话开着的时候按定时器重复,比如 /loop 5m check the deploy。它是给你当下盯着看用的。Codex 还没有 /loop 命令,等价做法是把 codex exec 包进一个 shell 循环,或者用 Codex 应用里分钟级的 Thread Automation。

/schedule <description> 创建一个云端例程,在你笔记本合上的时候照样跑,比如 /schedule daily PR review at 9am。这就是「我睡觉时」用的那个。Codex 的对应物是应用里的 Automations:可以按每日 / 每周 / 自定义 cron 跑独立、项目或线程级的自动化,结果落到一个 Triage 收件箱里(目前本地执行,云端执行正在铺开)。

讨论里反复踩的一个坑:两个工具都没有 /routine 命令。 Claude Code 里调度器叫 /schedule,Codex 里叫应用内的 Automations。动词用对了,下面每个循环就都能跑。前 11 个直接来自 X、TikTok、Reddit、GitHub,带着互动数据;最后 4 个是从一份值得一抄的目录里挑的,我都标注了出处。

11 个大家真在跑的循环

1. 构建—测试—修复这一对(loop)

整批里被演示得最多的循环,来自一位叫 raycfu 的创作者,他那条 walkthrough 在 Instagram 上拿了 43,587 次观看、1,040 条评论。两个智能体:一个 builder 写代码,一个 checker 跑测试、类型检查和 lint,并准确报告哪里坏了。两边来回传,直到干净为止。它要解决的痛点很直白:一次性(one-shot)智能体会把自己的 bug 一起发出去。

/loop build the next item on the plan, then run tests, typecheck, and
lint. Feed every failure back as the next instruction and fix it. Stop
when the build is green and the checker has nothing left to report.

2. Boris 的验证者循环(loop)

这是 Boris Cherny 本人对这个循环的描述,也是互动最高的版本(@bcherny,781 赞):让 Claude Code 加一个高级模型再加一个验证器一起在循环里跑,喂任务给它,边跑边清掉瓶颈。验证器是每个人都跳过的那一环。 没有它,你只是在盲目信任智能体。

/loop work the task list. After each task, have a separate verifier model
check the result against the spec and the tests. Only move on when it
passes. Surface anything the verifier rejects twice.

3. 循环工程师起步模板(harness)

真正「手把手搭一个」的视频里观看最多的,来自 AI Jason(15,436 次观看,537 赞),他放出了一个免费的 loop-engineer 模板:一套代码库 harness 加一份知识模板,克隆下来、指向你的仓库、跑起来即可,省得你从零开始接「构建—观察—验证—停止」这些管线。如果你今晚就想让一个循环跑起来、又不想自己设计底层,这是最快的入口。

git clone https://github.com/JayZeeDesign/loop-engineer-template

4. 五分钟仓库维护者(loop)

Peter Steinberger——过去 30 天在他的各个仓库里合并了 859 个 PR、接受率 95%——把这个循环挂在一个很紧的定时器上:工作期间每五分钟,智能体就做一件小而经过验证的维护。清理什么由智能体自己判断,而不是写死的脚本。那个「自己判断」才是关键。

/loop 5m make one small verified repository improvement: a flaky test, a
stale comment, a missing type. One change, one commit, tests green. Never
touch anything risky.

5. 计划—生成—验证—修复循环(goal)

一位叫 qbuilder 的创作者(TikTok,4,560 次观看,125 赞)跑的是一个有边界的版本,专治跑飞的问题:计划、生成、验证、修复、重复,每一步都存进文件,硬上限是五轮。你只读最终版本。正是这个上限让你敢放手走开。

/goal plan the task, implement it, verify against the tests, and fix what
failed. Save state to files each pass. Max 5 iterations. Stop at the first
clean pass or when the cap is hit, and tell me which.

6. roborev:提交后审查器(已发布工具)

roborev 是一个免费开源的代码审查工具(一个 Go 二进制,从 roborev.io 安装),是 Dan Kornas 带火的。它装一个 git hook,每次提交都触发一次后台审查,然后趁上下文还热乎,把发现喂进一个智能修复循环。发布推文只有 20 赞、很安静,但仓库本身才是真信号:1,410 星,而且我写这篇时它当天还在提交。它本质上是把这整篇文章反复强调的那个难点——一个活在循环内部的验证器——做成了可安装的版本,能接 Claude Code、Codex 和 Gemini CLI。

roborev init    # 装一个 post-commit hook:每次提交都触发一次审查
roborev fix     # 修复发现问题的那个智能体循环

7. 目标元技能(goal)

本月最出圈的技能,由 evgenii.arsentev 带出(32 赞,950 次观看),几天就涨到 600 多星:这个技能唯一的工作,就是把一个含糊的请求改写成一个严谨的目标——指明要什么结果、怎么验证、什么不能碰、什么时候停。用他的话说:你的智能体不笨,是你的指令太含糊。

/goal before doing anything, rewrite my request into a precise goal: the
exact end state, how you will verify it, what you must not touch, and the
stop condition. Confirm that goal, then execute against it.

8. 每天 15,000 封邮件的循环(routine)

r/LangChain 上有人贴出了一个邮件智能体的完整架构,每天处理 15,000 封酒店客人的邮件:它循环遍历收件箱,分类并起草回复,只把需要人工的那些上报。这是 Reddit 上少见的、真把完整生产循环贴出来而不是演示的帖子。

/schedule every 15 minutes, pull new guest emails, classify each, and
draft a reply for the routine ones. Queue anything sensitive for me and
log every decision. Never auto-send a refund or a booking change.

9. 反空转循环(loop)

Reddit 上设计得最好的循环,是一个发在 r/claudeskills 的 Claude Code 技能。它自主地跑「构建—审计—验证」这个循环,直到一份机器可校验的契约通过,并带着明确的反空转停止条件:无进展检测、重试上限、反复横跳检测,还有预算。它存在的理由,用作者的话说:大多数智能体循环从不停下来问自己「我是不是真在前进」,于是要么一遍遍重试同一个坏方法,要么干脆偷偷改测试让它通过。

/loop build toward the goal, then audit and verify against a
machine-checkable contract. Stop if you make no progress, repeat an
approach, flip-flop between approaches, or hit the budget. Finish only
when the contract passes.

10. 写循环而不是写代码(routine)

这一切的开端,出自造了 Claude Code 的那个人:他不再写代码了,他写循环,循环在他睡觉时写代码。流传最广的版本(@0xMovez,984 赞)给了个数字:他现在 30% 的代码完全由循环写出。形态是一个定时例程,盯着你的 PR,夜里把能修的那些落地。

/schedule every night, watch my open PRs. Auto-fix build failures, answer
review comments in a fresh worktree, and rebase what is stale. Leave
anything ambiguous for me. State in git so a crash loses nothing.

11. 人在环上的审批队列(loop)

来自无代码圈最实用的一个模式,出自 r/n8n 的一个帖子:工作流跑起来,然后暂停,给你发一条带「批准 / 修改 / 跳过」按钮的消息,把人工审核当成一个有提醒、有截止时间的独立队列来处理。循环形态一样,只是停止条件从「测试通过」换成了「你的批准」。

/loop run the task, then pause and send me approve / revise / skip on
Telegram before anything ships. On approve, continue. On revise, take my
note and redo. On skip, move to the next item.

还有 4 个,值得从目录里抄

剩下这几个真正即抄即用的循环,住在 Matthew Berman 的 Forward Future Loop Library 里——一份经过人工筛选的目录,信号是「审过」而不是点赞数。这四个仅凭实用性就够格。

12. 生产错误清扫(goal,来自目录)

Berman 实用性最高的一个 goal。它读你的生产日志,把真正可处理的错误和噪声分开,给可处理的那些写上测试做修复,然后开一个 PR。价值在于分诊;你得告诉它「可处理」到底指什么,否则它会去追幽灵。

/goal review the last 24h of production errors. For each one that is
actionable and reproducible, write a fix with a regression test and open
a PR. Ignore transient and third-party noise. Done when the actionable
list is clear.

13. 连续通过循环(goal,来自目录)

还是 Berman,这个尊重了「它能跑」到底有多不靠谱。它不在第一次绿灯就停手,而是用真实场景反复测,只有连续通过一长串才宣布胜利。一次绿灯是运气,一连串绿灯才是可靠。

/goal run the full product test suite against realistic scenarios. Fix
whatever fails, then run again. A new failure resets the count. Done only
after 10 consecutive clean passes.

14. 对抗式审查的利器(已发布命令,来自目录)

Lukas Kucinski 的 Clodex 循环,让 Codex 在合并前审 Claude 的 pull request,于是两个不同模型家族必须达成一致,代码才能落地。原封不动粘贴就行。

/clodex [task] think hard --max-iter 5 --threshold medium

--max-iter 5--threshold medium 就是精髓所在:它最多跟自己吵五轮,只放过越过门槛的那部分活。

15. 完成契约的利器(已发布命令,来自目录)

3goblack 的循环(@Dis_Trackted)治的是最常见的毛病:智能体明明没干完却说「完成了」。在任何工作开始之前,它先写一份契约,定义「完成」是什么、每条要求要拿什么证据来证明,然后没有证据就拒绝宣布成功。

$goal-planner-codex [task]

炒作略过的那点:循环就是一堆烧钱,上面架着一个验证器

跨平台扒下来,同样的两条警告反复出现,而且社区原话比我说得有意思。

第一条是成本。 循环的浪漫版本是「一千个智能体一夜之间替我把公司建好」,生产版本是一张账单。Uber 在四个月里烧光了年度 AI 预算,之后给工程师定了每个工具每月 1,500 美元的上限。Reddit 上有人一条命令一夜烧掉约六千美元,那个帖子拿了 1,273 个赞。整场运动最好笑的总结,是一条写成代码的 YouTube 评论:

while (you have tokens): Burn them in a loop! 就是这么回事。

—— TrMarwane,YouTube,196 赞

所以每个目标都要有预算,每个循环都要有上限。目标条件可以带上「或在 N 轮后停止」,例程按计划跑、设每日天花板。天花板要在你走开之前设好,而不是等账单邮件到了才设。

第二条是验证,而这才是整盘棋。 一个分不清好坏输出的循环并不帮你省事,它只是更快地产出错误答案。

一个分不清好坏输出的循环,只是把「犯错」自动化得更快了。写循环很简单,难的是循环里那个验证器。

—— @ahmetbilicanxyz

这正是为什么 /goal 要跑一个独立模型当裁判,而不是让干活的那个给自己批卷子;也是为什么上面最强的几个循环(Boris 的验证者、构建—测试—修复那一对、Clodex)都在循环内部塞了第二双独立的眼睛。一个给自己打分的智能体,会把不过的测试删掉然后宣布完成。这件事上,怀疑派坚持得对。

至于「循环工程是不是新瓶装旧酒」,也有人泼冷水(Maximilian Schwarzmüller 的循环工程视频,2,036 赞:「又来了,还在写提示词?你太落伍了。」)。他说对了一半:调度那一层确实就是 cron。但 cron 从来没有的,是循环体里那个会读状态、动手、检查有没有成、再决定要不要继续的决策者。这个决策才是真正新的东西,其余都是管线。

今晚怎么开始

你用不着把十五个都上。我扒下来反复收敛到三步,三种类型各一个:

  1. 构建—测试—修复那一对作为 /loop 跑,让你盯着的时候有东西在可衡量地变好;
  2. 五分钟维护者作为 /loop 在你工作时跑;
  3. 写循环 PR 例程作为 /schedule 在夜里跑,让你醒来就有干完的活。

每一个都给上预算和验证器。明天早上你就有一套能用的循环栈了。

大家都在绕着说的那个转变是真的,而且比讨论里听起来简单得多:别再当循环里的那个零件。 写好目标、循环或例程,给它预算和自我检查的方式,然后去决定下一个该建什么。正如一位疲惫的实践者在被问「智能体干活时你到底该干嘛」时说的:

出去散散步。给妈妈打个电话。做顿健康的饭。好好照顾自己。

—— justinkthornton,Reddit,r/codex

本文整理自 Matt Van Horn(@mvanhorn)的《WTF Is a Loop? Part 2: The 15 Loops People Are Actually Running》,是 上一篇循环工程 的续篇。命令均保留英文原文,方便直接粘贴使用。


关于

关注我获取更多资讯

月球基地博客公众号二维码,扫码关注获取更多 AI 与编程资讯
📢 公众号
月球基地博客作者个人微信二维码,扫码交流 AI 与编程话题
💬 个人号
使用 Hugo 构建
主题 StackJimmy 设计