天猫的反爬加强了?

2016 年 8 月 26 日
 spikeLIN

这两天突然发现很多都爬取不了,把失败的 url 丢进去一看,发现都需要登录才能浏览了.
平时是自己弄了个代理池,每次爬都从代理池里面随机取代理爬的.
这样都被反爬了还有什么好的方法吗?

5220 次点击
所在节点    Python
6 条回复
petelin
2016 年 8 月 26 日
登录进去拿到 session 就行了,又没说 session 和 IP 必须一匹配,不知道你什么意思。
qianlifeng
2016 年 8 月 27 日
我也发现了,还在想怎么弄
ljcarsenal
2016 年 8 月 27 日
求教你们整天爬来爬去的有什么经济价值?
bf68
2016 年 8 月 27 日
@ljcarsenal 同问
mrcode
2016 年 8 月 27 日
@petelin 登陆后拿到的是 token 吧。:smile:
petelin
2016 年 8 月 27 日
@mrcode 想说 session id. 脑抽了,当时看到这个问题感觉很无聊,,,

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/302019

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX