maolon 最近的时间轴更新
maolon
ONLINE

maolon

V2EX 第 442547 号会员,加入于 2019-09-22 10:16:39 +08:00
今日活跃度排名 2216
maolon 最近回复了
1 天前
回复了 stinkytofux 创建的主题 全球工单系统 智谱 GLM-5 是不是来搞笑的?
我倒是比较好奇, 智谱这几周在 v2 上都给骂成什么样了
是什么让你决定继续去买的
一些评论:
2022 ai 最多完成个补全
2023 ai 最多改几个文件,还要复制黏贴麻烦的很
2024 ai 写一个 demo 差不多了,玩具而已
2025 ai 根本搞不定复杂的设计和屎山代码的生产老项目, 还有出问题了谁来背锅?
2026 ?

人要向前看的, 这玩意儿 4 年前还是个补全代码都能出错的东西,你可以说 boris 自卖自夸在那里暴论,但是趋势就是 agent 开始趋向于自动化,自我完善化,agent 组织架构化( kimi 的 swarm, cc 的 agent team, codex 的 spawned agent ),这里同样有另一个 openai 实践完全自主化 codex 完成大型项目的例子: https://openai.com/index/harness-engineering/,

还局限于讨论屁股坐哪里我觉得意义不大,讨论讨论人类位置应该摆在哪里,HITL 应该做到什么程度,agent autonomy 应该给多少权限才是今年的话题
1 天前
回复了 hlwjia 创建的主题 Codex 感觉 Codex 没有 Claude Code 那么耗 token 啊
codex 现在送 2x 的用量这是其一, 然后 codex 最出色的是他的 auto compact 系统,他自己知道什么时候该 compact 而不是非得等到一个窗口用完才 compact ,最后 codex 本身比较少 verbose ,也是省 token 的一环
那确实,之前在红迪上看到有人拿 seed dance 2 把妹非妹的崩坏集给重置了,这套东西再可控一点恐怕很多厕纸的外包就会大量使用这种方法来生产内容了
4 天前
回复了 Winner4good 创建的主题 问与答 求文档 ai 率查验工具
没有 这些都不准,因为 ai 检测相对准确只有两种方法 1. token 级别的水印(需要提供商主动加入) 2. 开源模型知道本身 token 的分布

而这些网站/工具本质上就是拿大量的 ai 生成文章训练分类器,或者辅助通过检查文本困惑度和突发性来提供更强的 ai 文章信号,问题在于 llm 模型更新速度太快,每一代的新模型又是重新训练和微调的,基本上这些网站工具是很难跟得上进度的,准确度基本和扔硬币差不多

这个问题不应该使用工程手段而是应该通过管理手段来解决
当年打字员还是个职业呢,现在呢?
编程自然语言化和基础技能化那是必然趋势

但是会编程不代表你是程序员,更不代表你是软件工程师(虽然软工这个职业还存不存在可以另外讨论)
我觉得之前的 openai 的 5.3 codex spark 已经很有想象力了, 没想到这个更夸张
> 而是纯粹概率学上的堆砌
不对,至少有论文讨论 predict next token 是贝叶斯的

> 几乎全部 AI 回答都是走过去,所以短期内 AI 编程无法全自动化
不对,corner case 不能代表什么东西,以及这两个之间也不构成直接逻辑关系

每天看这种重复的讨论真的有点累了
是 powershell 的问题 现在大模型默认训练的是 posix 那套命令,powershell 的训的太少了经常出错,windows 下想正常用要不 wsl 要不 git bash
这个都不用问的,
全自主 agent 和超长程任务(> 15hr 持续执行)用 gpt 系列( 5.2 high/xhigh and/or 5.3 codex high/xhigh ),
copilot 模式(你和 agent 合作写)用 claude 的 sonnet 4.6 + opus 4.6,
另外建议搭配各家自己的套餐使用(也就是 codex 用 gpt 订阅,cc 用 claude 订阅),以及 opus 价格非常高,注意使用限制
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2799 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 14:35 · PVG 22:35 · LAX 06:35 · JFK 09:35
♥ Do have faith in what you're doing.