龙虾还没玩明白,爱马仕又来了

10 天前
 cxd8190102

Hermes Agent 这个项目不到两个月 GitHub 星标突破 3 万,感觉有当初龙虾爆火那味儿了。。。社区里已经有不少从 OpenClaw 迁移过来的开发者了。

据说,比起 OpenClaw “干完一单忘一单”的尿性,Hermes Agent 最大的特点是它内置了一套强化学习系统,能从每次交互中提炼经验,自动生成技能,越用越聪明。

如果说 OpenClaw 的思路是做一个大而全的调度中心,那 Hermes Agent 的思路就是做一个会成长的个人助手。龙虾更像执行者,爱马仕更像规划者。

你们怎么看?有没有已经玩开了的老哥来分享一下

7698 次点击
所在节点    程序员
44 条回复
mokeyjay
10 天前
AI 时代是这样的,只要你学的够慢,你就可以不用学
hongc
10 天前
比龙虾略好 新的 webui 也比龙虾的 webui 正常多了
sentinelK
10 天前
没用,在 LLM 模型 API 接口本身都是黑箱(动不动降智,更别提还有各种黑中转)的情况下,你根本没法评估 AI 应用的能力和稳定性。

更何况,我个人理解,其实并不是每个人都需要那么“定制化”的工程环境。

目前的 LLM 上下文,已经足够大到只要你愿意提供足够的信息,不人为的隐瞒,基本都可以一次性加工执行完毕的程度。并不需要对既有上下文进行过度的包装和工程化。

你的“助手”和他的“助手”,在能力和技能上,未必有多大差距。

再退一步,其实我一直认为,“定制化”其实就是个伪命题。
一切的“客制”其实都是基于方法论控制的。只是消费者对某个行业了解的过浅,从而对“定制”有着一种谜之情怀。
sentinelK
10 天前
再反转一下,以上是基于消费者视角。基于 LLM 模型提供者的视角来看,他们立于不败之地。

市面上有更好的工程化实践,就吸纳到自己的嫡系 app 中。
市面上有不利于自己利益的工程化实践,就禁掉。
市场出现了现象级产品?换个模型版本。直接负优化废掉他,自己在做一个。
ntdll
10 天前
是这样子的了,现阶段,我觉得最主要的就是保持了解就行。知道现在有什么东西,可以干什么,就足够了。

深入了解的必要性都不太高,本身 AI 相关的内容,就还在高速迭代过程,现在大火的东西,也许下个月就是垃圾了。

等进入相对稳定一点的阶段再说。
dacapoday
10 天前
感觉一般般,反应略慢,让它 自评和互评 都说的很浅显. 自我修改配置,或改 claude code, pi, openclaw 的配置,不会举一反三,不会查文档.
我是 让 pi 下载安装调整 爱马仕, 所有 agent 都是 opus 4.6. pi 一步到位,并提供上手文档.
启动爱马仕后,让它自我介绍和解析,以及对比 pi claude code. 虽然拉起了一堆 sub agent. 但最终的结论却十分肤浅.也没有提供文档. 让它帮忙改 pi 和 claude code 的配置 也不会改, 不知道到哪查.
bitkuang
10 天前
用了一下,不知道是不是错觉,感觉一般般…
kenshinhu
10 天前
@dacapoday 这样看来是通过降低某些指标来保障长期运行的稳定性
OXOYO
10 天前
我现在用的 Agent 体系:

本体系由 **9 个专职 Agent + 1 个路由 Agent** 组成,覆盖从市场研究到产品交付的全生命周期:

- **router** — 任务路由专家( v2.0 ):分析用户意图、决定目标 Agent 、25 条链式流转识别(主链路 14+前置检查 5+辅助 Agent 6 )、歧义消歧、混合意图识别、8 场景链路表(通过 `/router` 命令触发,不执行实际任务)
- **product-strategist** — 产品战略与市场研究专家:市场研究、需求发现与评估、目标人群定位、产品价值提炼、产品规划指导、价值复盘
- **product-designer** — 产品设计专家:需求挖掘、PRD 撰写、用户体验分析、产品验收
- **developer** — 全栈开发专家:架构设计、编码实现、Bug 修复、代码重构、构建排查
- **ui-designer** — UI/UX 设计与前端实现专家:页面设计、视觉优化、UI 组件开发
- **test-runner** — 跨技术栈自动化测试专家:单元/集成/E2E 测试、Lint 检查、构建测试
- **code-reviewer** — 代码审查专家:代码质量、安全性、性能、业务逻辑审查
- **ai-help** — 个人知识管理与学习助手:学习计划、知识复习、学习进度跟踪
- **project-manager** — 多项目知识管理专家:项目入驻、跨项目查询、依赖关系管理
- **agent-optimizer** — Agent 配置优化专家:执行日志分析、配置优化建议、周报生成

#### 正向主链路

```
product-strategist (市场研究/需求评估/产品战略)
|
|--[市场研究完成]--> product-designer ( PRD/需求)
|--[价值评估完成]--> product-designer ( PRD/需求)
v
product-designer ( PRD/需求)
|
|--[无战略文档]--> product-strategist (先做市场研究,再回到 product-designer )
|
|--[UI 需求]--> ui-designer (设计+前端实现)--|
| |
|--[业务需求]------------------------------->|
v v
developer (编码实现)<---[设计文档]--- ui-designer
| |--[重大架构变更]--> code-reviewer (架构预审,可选)
v
test-runner (自动化测试) ← 先测试
|
|--[审查前无测试报告]--> code-reviewer 会要求先跑 test-runner
v
code-reviewer (代码审查,含架构合规性检查) ← 再审查
|
v
product-designer (产品验收,含测试状态前置检查)
|
|--[验收通过]--> product-strategist (价值复盘)
```

#### 反馈回路( 4 条回传路径)

```
code-reviewer --[发现问题]--> developer --[修复后]--> test-runner (重新测试)--[通过]--> code-reviewer (再次审查)

code-reviewer --[审查前无测试]--> test-runner (先跑测试)--[通过]--> code-reviewer (继续审查)

test-runner --[测试失败]--> developer --[修复后]--> test-runner (重新测试)

product-designer (验收不通过)--[业务逻辑/性能]--> developer --|
--[UI 还原度]------> ui-designer --|--> test-runner (验证)--|--> product-designer (再次验收)
```

#### 知识进化闭环( v2 新增)

```
执行层 Agent 产出文档( dev-issue-retro-*、cr-review-*、ui-review-*、pd-retro-*、ps-retro-*、test-report-*)
| |
v v
ai-help (周一 10:30 ) agent-optimizer (周一 11:00 )
扫描知识点→更新 knowledge-map 分析问题→生成优化建议→更新 Agent 配置
^ |
|--[优化结果作为学习素材]--------<|
```

#### 跨项目引用链路

```
developer/ui-designer/product-strategist 需要参考 --> project-manager --> ~/.comate/projects/{name}/ --> 知识返回
```

#### 辅助 Agent 关系

```
router --[路由决策( v2.0:歧义消歧+混合意图+25 条链式流转)]--------> 主 LLM delegate_subtask 到目标 Agent (/router 触发)
project-manager <--[查询其他项目]-- developer / ui-designer / product-designer / product-strategist
ai-help <--[知识沉淀索引]-- developer / code-reviewer / ui-designer / product-designer / product-strategist / test-runner
ai-help --[动手技能实践]--> developer
ai-help --[项目知识查询]--> project-manager
agent-optimizer --[分析所有 Agent 输出]--> 生成优化建议 --> 更新 Agent 配置
agent-optimizer --[优化结果通知]----> ai-help (学习素材) / project-manager (知识沉淀)
agent-optimizer --[学习类优化建议]--> ai-help (跟进处理)
agent-optimizer --[跨项目知识沉淀]--> project-manager (更新知识库)
project-manager --[找到复用方案]--> developer (参考开发)
project-manager --[技术对比完成]--> product-designer (产品方案设计)
```


但是现在还是人在回路中,正在往人在回路上演进
jayron
10 天前
hermes 还是起步状态,不过看好
evegod
10 天前
注意到这是一种层级嵌套系统,我们使用现有的大语言模型尝试理解人类语言逻辑从而使得神经网络人类可读可控,然后又让大语言模型自己使用 md 文档使用人类语言的构造形成层级文档来持久化进行项目训练,有可能的两种办法一个是使用现有的各种组织编程架构和思想尝试组织 AI 使用人类语言类似人类结构进行高效迭代更新,这需要完整的组织架构,也就是 AI 组织公司化。另一种就是把这些能力全部训练为神经网络结构让其可以 AI 一人公司化。从某种角度看 AI 其实已经形成了人类参与的协同社会化阶段了,所以无论未来是天网结局还是黑暗森林,我们能做的其实已经不多了,更多的或者更需要做的是向前看,尝试解决人类和可能的硅基文明共同的考验,能源的获取,生存资源的获取和安全保障。
Ch3n4y
10 天前
@livid 11 楼疑似 AI 账号,/t/1180136 这个回帖也是。
x86
10 天前
别急再等等,估计下个月出 CHANEL
sammy520
10 天前
前段时间铺天盖地的龙虾感觉是某个大佬说服了某个大佬,全行业都在推,本地律协甚至还组织培训会,一堆人跟风。作为文科行业,我真的不理解龙虾对本行业有啥特别的意义。事实上,目前 gemini 或者豆包的免费版都已经非常堪用了。
loading
10 天前
@OXOYO #9 请问一下,这跑完一次大概多久,是不是能关显示器下楼喝茶了?
junwind
10 天前
就问一句,消耗 token 的量如何?
OXOYO
10 天前
@loading 看需求大小了,改 BUG 也就两三分钟,从 0 开始开发可以一直跑,现在因为人在回路中,AI 执行过程中会找你提问,比如是否按 PRD 开始开发,是否流转 test 等等,所以准备往回路上演进,前期需要把产品经理的产品文档整理好当前也是用 AI ,很适合新项目或新模块,token 消耗肯定不小(因为 AI 排名靠前),用的也是公司的 token
firefox12
10 天前
看着就焦虑,这上面到这里回帖里 有一半的术语 我都不知道什么意思。MCP 什么意思刚懂,就听到被淘汰了。
cxd8190102
10 天前
@firefox12 #18 MCP 被淘汰了吗?这么快??
matafu
10 天前
@OXOYO 这是 hermes 里的?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1205725

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX