在 AI coding 上的困境,想做个调研

15 小时 10 分钟前
 skuuhui

先说问题,不绕。。。。你们觉得目前你最常用的模型,在开放需求下它的功能、架构设计你能给它定多少年工作经验的程序员(或阿里 P 几水平)。

模型:gpt5.5 中(大部分功能设计,因为便宜),Claude Opus 4.6 我的困境:

  1. 如果我的需求过于开放,在 plan 的时候,架构功能设计质量非常不稳定,大多数时候在我擅长领域我认为只能达到 4 年的程序员水准。
  2. 如果我给的过于严格的边界和约束,那么会变成 AI 的上限就是我的上限,又太过于突出个人能力或者弱化了 AI 的能力。
  3. 如果我给的过于严格的边界和约束并且总是坚持我的想法,那就变成了我在教 AI 做事,这里大量的成本在我和 ai 的沟通,并且需要它完全明白我的意思。

当然,上面的所有前提都是一个生产项目和程序员职业。自己 coding 玩具项目或者非程序员岗位不算

1685 次点击
所在节点    程序员
18 条回复
sentinelK
14 小时 56 分钟前
1 、我会干预其架构设计。不是别的,是因为我要为我的 Agent 兜底,他的技术选型我看不懂我就兜不了……
2 、看心情,所以我目前在尝试可能的情况下,让 hermes 接管我的代码仓库和文档,让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。
3 、同理,hermes 可以大幅度降低人工提供上下文的心智负担。
someonelikeyouah
14 小时 53 分钟前
偏个题,评估这个意义在哪里? 你自己知道上限 下限 能做到哪里就行了,评级是为了给公司指出开发的预算么?
sentinelK
14 小时 51 分钟前
btw:使用大模型,核心矛盾点,就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。

你给员工更大的自由,他就更能发挥上限,代价就是捅娄子的能力也更强。
你越依赖微操,你的员工的能力就越难以发挥,也就越难以突出你的人力优势。这里要 @蒋委员长
lmmlwen
14 小时 50 分钟前
一个小小的程序员如此大放厥词,ai 编码是无上限的,只是你和你们的项目代码过于平庸,它只是选择了一个最为中庸的结果给你。
lmmlwen
14 小时 49 分钟前
阿里 p8 的 py 代码,还得我来修改一轮低级 bug ,这没有任何意义
skuuhui
14 小时 47 分钟前
@sentinelK 我会尝试一下你的方式。但有时候我会总会觉得,流程越复杂,ai 调用层级越多,出错的概率越大 0.99*n
skuuhui
14 小时 45 分钟前
@someonelikeyouah 人类可能是以后公司内唯一需要承担责任的少部分实体。如果一个功能 AI 跑了 2 天,上限直接奔溃了,老板可不会追责 AI
skuuhui
14 小时 42 分钟前
@lmmlwen bug 还只是最简单的错误了。如果一开始实现上就存在隐患,如果后期产生问题,影响范围和修复成本都很高
sentinelK
14 小时 40 分钟前
@skuuhui 这个直觉没错的,但是对应的账应该反过来算。
1 、你降低了你自己的心智负担,你就更有时间、精力来给模型兜底。
2 、目前主流的 Agent 思路是 loop + 审核抽卡,所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。
3 、目前模型的能力更强了,最优解的统计学优势更明显,即便上下文有一系列错误,也会无视或者自行纠错。
someonelikeyouah
14 小时 40 分钟前
@skuuhui #7 可行性分析现在是开发来主导了么?
teaguexiao
14 小时 26 分钟前
我的做法是先让 AI 出两三个方案,我挑一个架构方向再让它深入,这样既保留了它的发挥空间,也避免一开始就跑偏。开放需求不等于无约束,提前给定一些不可碰的边界(比如技术栈、分层规范)能显著稳定输出质量。
foryou2023
14 小时 17 分钟前
需求描述清楚,让 ai 给解决方案,符合自己需求的方案,然后再细化,需求细节讨论的差不多了,然后写文档,再让 ai 干活。

现实跟产品沟通不也是这样的么,沟通清楚需求,然后自己出解决方案,然后实现。

现在只不过变成了指挥 ai 干活而已。
foryou2023
14 小时 14 分钟前
@foryou2023 认知上把 ai 当成一个啥都会干的人,正常沟通,这样操作,个人实践过程中感觉挺好的。
skuuhui
14 小时 1 分钟前
@someonelikeyouah 我期望不是由开发来主导,但目前是开发来担责,谁也不愿意担责。
huoru
13 小时 16 分钟前
你们还 review AI 写的代码吗?
skuuhui
13 小时 9 分钟前
@teaguexiao
@foryou2023
你们的方案是所有能看到的技术贴都提到的并且也最为大家熟知的。但我是无论是严格执行还是局部优化结果都差强人意,至少去年 9 月我就是实践过这一套了。所以我好奇,说这些理论的人是缺乏实践随口一说停留的想象层面,还是自己有一套自己专属的驾驭方式只是没有表达清楚。
另外:其实你定义了约束就是限制了开放性,如果指令遵循的好,他永远设计不出超出你边界外更合理的设计。这本质上来说和你教他怎么做一样。无法就是一个是我告诉他要做什么,一个是我告诉他不能做什么。
Cabana
9 小时 16 分钟前
所以再等等下个世代的基础模型吧, 就不会有这么多需要在工程上去处理基础模型的能力边界问题了。目前的话就只能修修补补咯~
paranoiagu
8 小时 59 分钟前
你是产品经理,AI 是原来你的手下小伙伴。

你觉得该怎么用这些小伙伴就怎么样用。AI 比小伙伴更加肯干,知识更加全面,没有怨言………………

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1211116

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX