第五次重装 hermes, 有些经验希望给准备用的人参考一下.

1 天前
 Hermitist
4 月初的时候我搞了个小龙虾, 结果这家伙经常死机, 用起来很累.

后来 hermes 出来的时候,我开始试用, 感觉比龙虾好用好多, 最起码看起来算个能干活的, 中间几次版本迭代更新,以及试用各种本地模型, 来回折腾重装了很多次, 最终决定还是长期使用它, 有了这个定论之后, 开始大规模的下载大模型到本地电脑一个专门的文件夹, 然后复制到 omlx 的 models 文件下并随时启用测试.

另外还安装感觉目前最好用的 webui: https://github.com/EKKOLearnAI/hermes-web-ui/blob/main/README_zh.md

以及这几天刚出来的自我进化 skill: https://github.com/NousResearch/hermes-agent-self-evolution

同时参考了这个:https://github.com/0xNyk/awesome-hermes-agent 以及 x 上几个博主, 跟进下最新进展以便随时跟进.

目前 32G 内存 air, 我试过最大可以勉强跑 qwen3.6-35B 的 4bit 量化版本,还有 Gemma4-26B,输出速度很慢但我经常在睡觉前扔给它一个任务, 睡醒了基本上都可以执行完毕, 虽然不随心应手, 但勉强能用.

为了不让 Mac 崩溃, 我还让 Hermas 设置了一个自动监控任务, 一旦内存占用超过危险的可能导致系统崩溃并重启的 92%,立刻降低推理和演算速度, 确保系统不崩溃, 这个任务设置后,效果非常明显.

我用了一个风扇对着 Macbook air 吹, 降温效果明显, 在上述自动内存监控任务启动后, 高温的机会也少了好多.

感觉瓶颈最终还是硬件, 在 M5 Mini Mac 没上市前, 还是先保持跟进吧.
3382 次点击
所在节点    Hermes Agent
24 条回复
yjl953488
1 天前
看来我的电脑不适合。哈哈
wsbqdyhm
1 天前
谢谢分享,目前用 open-webui 接入,
ayasealter570
1 天前
这个 webui 确实比我之前用的舒服很多。
pencilq
1 天前
我是在服务器上跑 Hermes Agent ,接入了 OpenAI GPT 5.4 ,网关是 Telegram
darktiny
1 天前
本地模型不敢想,手机 Termux 安装了 Hermes ,用 deepseek v4 flash api 重构 Swift 代码,体验还挺好
miludeerKay
1 天前
换成 gpt 5.5
目前体验了快两周下来能完成我工作中的百分之 20 ,省去一些审核和操作的时间
PowerDi
1 天前
一般用来完成什么任务?
gbin
1 天前
我之前也折腾过 Hermes ,后来发现最大的坑不是模型能力,而是 Agent 需要访问外部系统时的认证问题。本地模型跑 Agent 做代码生成还行,但一旦需要读 Jira 、查文档、调 API ,认证就成了拦路虎。后来单独做了一层认证管理,跟 Agent 框架解耦,这样不管是 Hermes 还是 Claude Code 都能复用。
privater
1 天前
稳定性还是太差了,周末试着搭建了混用 miniMax 和 OpenAI api 想试试看 hermes 的自动路由,第一天勉强没遇到问题,第二天 open-webui 就各种撂挑子,一会是 message body error ,一会是传的截图识别不了,一番折腾又是一天,最后还是只能全盘重装。稳定性真没法跟哪怕是垫底的 chatGPT/codex 本地 app 比。反过来说大厂本地 app 除了烧 token 和速度响应,搜索比较一般,做正事上从不含糊,让你少了太多精力消耗在调试 harness 本身上。
94nb
1 天前
昨天用了一天这个 webui ,总是提示这条会话没有可用的工具执行通道,无法调用 terminal 直接执行命令,搞得我很烦,不知道怎么处理了
superkite
1 天前
没必要吧,这功耗有点像挖矿了
sm1314
1 天前
用反代出来的 gemini3falsh ,快的批爆,还免费不限量
r603282621
1 天前
webui: https://github.com/EKKOLearnAI/hermes-web-ui/blob/main/README_zh.md ,这个可以,使用了,谢谢~
Hermitist
1 天前
@gbin 我觉得你可以尝试直接扔给 hermes 本身解决这个问题看看? 我也遇到验证问题, 我提前把各种密码告诉 hermes 让它调用了, 当然让它做好加密(具体加密你其实可以一并提前告诉它的)




@94nb 这个 webui 其实迭代很快, 开发者有时候我看到一天能更新 2 次, 也是我试过几个中最好的一个, 你出问题可以尝试提交 issue 到作者 github 中,估计作者会很快回复你的.



@privater 自动路由我还没试过, 不过我觉得应该有好的 skill 可以协助完成, 懒得尝试的话, 可以发帖问问别的 v2er.
5200721
1 天前
我直接分了 2h12g 给我的新加坡龟壳跑,微信和 tg 都接入了,直接接了 6 个 team 号用 gpt5.5 ,还挺好用的
carrymaniac
22 小时 57 分钟前
想请教下 hermes agent 和 opencode 的功能差异是在哪里 因为我自己平时主要是开发多一点 下载来之后 在 TUi 上使用起来感觉好像差别不是很大 还是说有哪些更好的功能被我忽略了
sentinelK
22 小时 32 分钟前
@carrymaniac 如果只是对话任务,openCode 效果理论上讲是优于 hermes agent 的。

他俩是产品设计角度的不同。

openCode 能力聚焦在 Coding 上,hermes agent 是泛用性助手(系统自带 message gateway ,定时任务,有人格的概念等)。

举个不太恰当的例子,ClaudeCode 是一辆布加迪跑车,openCode 像是一个 F1 赛车,hermes agent 是家用 SUV 。
sentinelK
22 小时 27 分钟前
看了下这个“自我进化 skill”,这有点太损失稳定性了吧,他会让 hermes 去改自己的代码。
matafu
22 小时 2 分钟前
我使用的感受就是它的 memory 管理设计得不太行,啥都往 memory 里塞,也没啥优化或者多层级管理,这点远远比不上 claude
sentinelK
21 小时 53 分钟前
@matafu 确实,一边作者强调 memery 只有 2200 字符长度。hermes agent 这边随便什么垃圾信息都 memery update ,直到装满。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1209225

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX