最近在做一个自动化测试方向的 Agent ,核心思路是将前端代码仓库“切片”——即把组件、路由定义、字段校验规则、关键业务逻辑等拆成片段,通过 embedding 存入向量数据库,再配合一个 page-agent 接入 Kimi K2.5 模型。该 Agent 目前具备路由映射、字段规则解析、代码向量化检索、路由查询 tool 、页面跳转 tool 等能力,整体遵循 ReAct 范式,目标是实现一种能够理解代码语义、自主探索页面并执行验证的自动化测试。
整体流程大致如下:
1 、代码仓库切片:将前端仓库中的关键信息(路由、组件、表单规则等)拆成片段,通过 embedding 存入向量数据库;
2 、Agent 决策与执行:page-agent 接入大模型( Kimi K2.5 ),结合 ReAct 模式,利用路由查询、页面跳转等工具,根据用户意图(如“测试登录流程”)从向量库中检索相关代码知识,生成测试步骤并执行;
3 、闭环反馈:执行过程中如果遇到异常,Agent 可以根据报错信息再次检索相关代码片段,调整策略。
目前有类似的开源实践吗?或者有哪些大佬在尝试么?这套功能有落地的可能性么?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.