几小时的编程长任务到底是怎么做到的?

4 月 28 日
 andforce
经常在别的地方看到,AI 连续变成几小时。
拿 cc 举例子,具体咋做到的呢
6365 次点击
所在节点    ☕Vibe Coding🤖
43 条回复
momocraft
4 月 28 日
@andforce 你看你还是在把长时间当成目标。我的意思是 有用应该是唯一的目标,如果要再多一个目标就是节省人类时间

我最成功节省自己时间的时候是这样:

agent 在沙盒里跑,权限不管
人和 agent 一起在充分知识下做计划,计划足够具体且可行
执行的时候不容易偏,比如各 CLAUDE.md 里有足够具体信息,代码质量不差,agent 可以简单地自己跑测试
andforce
4 月 28 日
@momocraft #21 我看你是没有实际碰到具体使用场景,从而很难理解别人说的“长时间有用”。

我给你举个例子吧,我现在的场景是:
我白天在公司跟 AI 结对编程,这就不说了,就是提到的“人和 agent 一起在充分知识下做计划,计划足够具体且可行”,我跟 AI 确实在一起好几个小时。

下班后我接了 2 个网站开发的活儿,有时候我还会自己开发开源项目,这些项目共同的特点就是:没有严格的苛刻的需求验收,大体上实现功能就行了。

我想要在睡觉前,让 AI 把我这些活儿交给 AI 按照我需求一条一条干,我早上起来看一下。


现在你明白使用场景了吗?

“有用”怎么定义?在我这能给我完成活儿,挣到钱就好了,这就是对我有用的
ntdll
4 月 28 日
其实拆了,也很难维持。我经常遇到 Claude 说

我现在已经完成 xxxx ,下一步是 xxxx ,如果你愿意的话,我可以 xxxxx

然后就停那了,明明它啥都知道,就是要你回个“继续”

我也试过提示词里告诉他,直到完成之前,不要问我,也不用告诉我任何中间状态,但依旧出现:

我已经完成了 xxxx ,下一步要做 xxxx ,用户的原话是:xxxx (就是我那一句让他不要停的提示词)

然后停在那了,等我回复
nicaiwss
4 月 28 日
@ntdll 羞辱他不理解指令,告诉他 codex 要审核他的代码发现他居然没写完
kulove
4 月 28 日
感觉是卖课做自媒体才这么搞 这么长时间无法控制结果和质量的 我这边最多让它完成一个小模块 然后大概半小时左右
beimenjun
4 月 28 日
10 个小时的都有,cc 没有网络重试,就这么卡死了 10 个小时。

其实我觉得不要盯着时间,而是盯着产出……
maichael
4 月 28 日
如果你「思考清楚了」整个计划,那么「几小时」的长编程几乎都是代码生成,当然正常是不用几个小时的。
但是你是不可能提前「思考清楚了」,你正常只能想清楚大概,而且 LLM 生成代码也可能不出问题,不需要修正,所以包括「代码生成」、「 Cross-Agent Review 」、「路线修正」等等加起来耗几个小时是很正常的,当然,前提是你的机制(计划、loop 等)完善,才能一直跑不需要你介入。
mengdu
4 月 28 日
dabinDev
4 月 28 日
subagent 把
任务规划 agent
任务开发 agent
任务测试 agent
HomeZane
4 月 28 日
用了上几个 skill 就行,比如 superpower
不过让他写一个简单的 skill 就用了 4 个小时,让我对这个模式有点祛魅了
还是要关注产出,关注产出,关注产出
anyscript
4 月 28 日
github 上有一些开源的牛马框架 比如 https://github.com/kunchenguid/gnhf
jackOff
4 月 28 日
1-讨论计划
2-拆分计划和自验收标准
3-给一台干净电脑的全部权限让它操作,允许他自我编译代码
4-网络要极其好,网络波动或者断网,它就彻底断片了
Liftman
4 月 28 日
hook
zh3256
4 月 28 日
死循环
94
4 月 28 日
长时间跑容易丢失专注力然后跑偏。所以一般都是拆任务,然后按照任务清单去跑,并且产生检查点方便回溯。及时人工介入纠正错误。
要不然跑一两个小时发现牛头不对马嘴,花了时间又花钱了,拿不到结果不是炸了么。

我都是在前期多轮对话写好 Plan (会用多个模型去挑刺),再启一个新的终端让他自己跑一整个开发计划。加上自测和小步提交,也完全不需要非常长的时间。
如果只是小需求或者项目起步,需求清晰任务明确,时间长一点几十分钟就搞定了。

但其实很多时候问题出在 Plan 不够细致,Agent 跑到一半或者整个任务跑完了才反应过来漏了一部分的细节…… 所以我觉得端板是在我这边。
94
4 月 28 日
时间长一点几十分钟就搞定了 => 时间长一点几十分也就搞定了。
所以我觉得端板是在我这边 => 所以我觉得短板是在我这边。
#35
freak118
4 月 28 日
@XuDongJianSama 方式 2 遇到同时修改同一个文件会有问题吗
forbreak
4 月 28 日
我试过先写计划落地到 md 文件,然后告诉它按计划执行,直到计划完成在停止。 是可以一直做的,不加这句直到做完就不会一直跑。
AOK123
4 月 28 日
session limit 顶不住啊,5 小时窗口 1 小时烧完
teaguexiao
4 月 28 日
关键是任务拆解尽量细、每个子任务结果可验证,这样 context 不会被垃圾占满。我用 CC 时一般先让它出一份 plan.md 确认后再跑,单次任务不要跨得太大。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1208987

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX