有没有爬虫王!可以教下我 Websocket 怎么爬吗?

2025 年 8 月 8 日
 JoryJoestar

想要爬的网站: https://crushon.ai/character/7e388767-63c7-45e3-b922-53458b4ae4f7/chat

一直请求 403 ,难受,搞不定,用无头 playwrihgt ,又不过 cloudflare ,请求又被拒绝,难搞!

想请教一下 v2 的各位佬,怎么爬这个网站聊天对话。

6408 次点击
所在节点    Python
30 条回复
testliyu
2025 年 8 月 8 日
@peteretep 你是懂拿捏人心理的
alexchen7
2025 年 8 月 8 日
建议你看看 browser use 项目。
nomagick
2025 年 8 月 8 日
TophTab
2025 年 8 月 9 日
@peteretep #1 《提问的艺术》
ooTwToo
2025 年 8 月 9 日
指纹浏览器
ShineyWang
2025 年 8 月 12 日
huangpingdong
2025 年 8 月 14 日
@peteretep 怎么大胆,抖音弹幕都有人能爬 websocket 加密的还是
huangpingdong
2025 年 8 月 14 日
@peteretep 怎么大胆,抖音弹幕都有人能爬 websocket 加密的
JoryJoestar
2025 年 8 月 15 日
@991547436 牛的
JoryJoestar
2025 年 8 月 15 日
搞定了,用的有头 playwright ,手动过 cloudflare ,还可以吧,只需要确认一次就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/1150953

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX