求助,如何让 claude code 高效地操作浏览器

4 月 2 日
 zhuyannono
最近高强度使用 claude code 中,其中涉及到前端的网页 UI 界面的时候总感觉很不智能,人工介入太多。每次改完功能后多数时候要让我自己去确认验证功能,而且多半要反复修改才能到我满意的效果。我目前只用过 playwright 的 MCP server ,有点效果但是效率很低,绝大部分时候还是要人工验证。

官方的 chrome 控制要订阅,我用的是中转。我看到有些 CDP MCP server ,是否会更加好用一点?各位大佬有没有什么 skill 或者 MCP 推荐的。我主要是想让网页 UI 的验证能由 cc 自己完成,比如识别各类信息元素,自己点击输入模拟用户操作去验证功能,尽可能减少人工介入。
2072 次点击
所在节点    Claude Code
14 条回复
zcf0508
4 月 2 日
可以让 ai 接一下 https://github.com/zcf0508/unplugin-devpilot 我做的这个工具
yuanmomo9090
4 月 2 日
Playwright click 呢
yuanmomo9090
4 月 2 日
cli
IDAEngine
4 月 2 日
Playwright
east91555
4 月 2 日
Samwulol
4 月 2 日
了解下 pencil
Brodess
4 月 2 日
关注一下
dacapoday
4 月 2 日
让 ai 自己写一个:
1. playwright 无头版
1. playwright 无头版 + 反爬
2. CDP proxy 版,支持自动探索当前最新 profile path. 并判断浏览器 GUI 是否活跃,否则重启.
全用 skill 来集成.这样自己用 shell 也能调试.
MCP 太重了,也不方便.
asAnotherJack
4 月 2 日
试试前段时间出的 chrome devtools mcp
asAnotherJack
4 月 2 日
@asAnotherJack #9 配合新版本的 chrome
ijk0
4 月 2 日
推荐 agent-browser 他有对应的 skill ,让 CC 给你安装好即可
uni
4 月 2 日
很遗憾,我调研过市面上所有的方案,目前还真没有一套好的方案,包括我自己弄的也仍然不完美。将就用用,等技术的发展吧,我估计到今年底或者明年这样会好些
XuDongJianSama
4 月 3 日
除了工具,模型也挺重要的,试了 glm-5-turbo 操作浏览器挺丝滑的,点的对操作快,就是视觉只能靠 mcp ,等 glm-5v-turbo ,有视觉应该更好。不过 cc 能快捷切换 api 地址吗,没试过,我现在都用 glm coding plan ,写代码用 5.1 ,自动操作网页或手机用 turbo
PotatoTu
4 月 3 日

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1203070

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX