几小时的编程长任务到底是怎么做到的?

4 月 28 日
 andforce
经常在别的地方看到,AI 连续变成几小时。
拿 cc 举例子,具体咋做到的呢
6366 次点击
所在节点    ☕Vibe Coding🤖
43 条回复
cortexm3
4 月 28 日
给权限,比如 yolo 模式,加上支持自动任务的框架,比如 ralph 。
其实你让 AI 给你写个自动运行的工作流也一样。
0x5c0f
4 月 28 日
这个我之前也想了一下,应该是要加入记忆插件吧,或者类似记忆的能力, 比如要求先写计划书、每次功能编写都进行 git 归档,然后隔一段时间就让他自己 git log 看看完成任务,同步标记计划书,这个很多 ai 编辑器工具应该都具备,比如 kiro 的 plan 模式
tutulyy
4 月 28 日
插个眼,
中间状态飘了,最后产出根本没法收敛回来。
XuDongJianSama
4 月 28 日
三个方案
1:claude.md 或 memory 文件里写任务,直接让他干,等自动压缩能续上
2:主 agent 只调度,串行启动子 agent 干活
3:脚本循环启动

我用的 glm 搭配 cc ,1 很不稳,上下文大了容易坏。2 能干挺久挺稳。3 能无限干,实测好几天,还加了多角色切换
mengyaoren
4 月 28 日
oh-my-claudecode 的 ralph 可以执行长任务
june4
4 月 28 日
andlp
4 月 28 日
昨晚执行了一个 2h30m 左右的任务,就是一个 flutter 项目 clone 下来之后,让他成功运行并 build apk 和 ipa 出来,提示词就说一直做出 apk 为止,中途不要询问,不要停止,不要等待
benjaminliangcom
4 月 28 日
前两天试用 gsd-pi ,前期对好需求就可以进入 auto mode 了
tanrenye
4 月 28 日
你只要减少代码洁癖就可以做到
alfa
4 月 28 日
插个眼,现在跑了 16 分钟,看看最后跑完需要多久。
byteLoading
4 月 28 日
https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents

claude 之前有过一篇 blog 讲这个问题,大概的思路是:
1. 拆分任务
2. 搞个记忆机制,维护任务状态
3. 结合各种钩子,更新任务状态 + 选择下一个任务

可以使用这个思路去构建自己的工作流,不过任务拆分的粒度不够 + 模型不够强的话跑偏了的话,可能就是会浪费你大量的 token 又达不到预期的效果,所以就需要把任务拆分的足够小 + 搭配充分的验证任务完成的机制,这一步对人的经验要求还是比较高的。
shinelamla
4 月 28 日
插个眼,感觉这种也是有边界的,是不是多数适合从 0-1 做一个新项目?
whatcall
4 月 28 日
试试 devin.ai
注册送 20~50USD , 我随便拉个个开源项目,制定好任务步骤目标,让它跑个重构升级,它能一直跑很久,送的 50USD 很快就用完了。
wat4me
4 月 28 日
momocraft
4 月 28 日
为什么要用时间当指标呢?好像时间短了别人会觉得你无能一样

让 AI 做事和让人做事,评价应该是差不多的
把一个人捆在那几小时很简单,让他可持续地做对你有用的事才叫 管理
xingchenxf
4 月 28 日
不要听别人胡扯,能做到的方式就两种
1. 模型能力强, 我对比过 gpt5.5 啥都不做,只要告诉他一直做完,就真的一直做。而 gpt5.4 、sonnet4.6 就不行。
2. 暴力流:比如 loop / hook / while(true){claude -p "xxx"}
其他的基于 Prompt 的都是不靠谱的。 也就是说 claude.md 、skill 这些,都没用。
keshawnvan
4 月 28 日
1.提前写好比较完善的方案,并且有对应 skill 去约束按照方案执行,比如使用 superpowers
2.开启自动审查或者比较宽松的权限策略
3.使用比较强的推理模型
我测下来最多一次跑了七个小时,生成的代码还是比较可用的。
andforce
4 月 28 日
@momocraft #15 兄弟,你可以尝试这理解一下主题意思。

你只看到了“时间”,难道有人会单纯为了让 AI 长时间瞎跑吗?

那不是很明显个是想让 AI 长时间做最对自己有用的事么?
litchinn
4 月 28 日
试试 gstack + get-shit-down
IndexOutOfBounds
4 月 28 日
@tanrenye 很真实,喜欢微操就不适合长时间跑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208987

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX