某多多爬虫

2019 年 4 月 22 日
 Northxw

  某多多爬虫,anti_content 参数破解参考网上教程(因侵权问题,此处不公开链接),主要是通过是商品 API 完成商品信息的抓取,分析,存储,可视化等功能。

  Github: https://github.com/Northxw/Pinduoduo 欢迎提交 issue

9436 次点击
所在节点    Python
16 条回复
yepinf
2019 年 4 月 22 日
请教下,pdd 除了参数加密,还有什么注意点
有闲置服务器,想稳定爬它几个月看看
showHand043
2019 年 4 月 22 日
没有反爬措施嘛.比如汽车之家,大众点评那种
AnjingJingan
2019 年 4 月 22 日
pdd.txt 不存在
Northxw
2019 年 4 月 22 日
@AnjingJingan 跑一边程序就生成了,不可能把大文件放到 github 上啊。
Northxw
2019 年 4 月 22 日
@yepinf 目前还未发现其他反爬措施,不过大规模抓取的时候建议上代理。你先试试。
Northxw
2019 年 4 月 22 日
@showHand043 反爬措施就是参数加密啊(注意:注意看我的抓取链接),汽车之家和大众点评是网页字体反爬。
AnjingJingan
2019 年 4 月 22 日
@Northxw 跑程序报了这个错
Northxw
2019 年 4 月 22 日
@AnjingJingan ???贴代码,我看看什么错误。
Northxw
2019 年 4 月 22 日
@AnjingJingan 或者你加我 QQ:2443498314, 密保问题:佩奇(备注来意)
luanguang
2019 年 4 月 22 日
原本想 star 的,看到这么多有趣的爬虫,还是 follow 吧。
Northxw
2019 年 4 月 22 日
@luanguang 哈哈 都行的, 互相学习
stcasshern
2019 年 4 月 22 日
露珠下步计划是啥,感觉下步分析比较有趣
Northxw
2019 年 4 月 22 日
@stcasshern ???哈哈,你想要什么
ricky0603
2020 年 5 月 21 日
楼主的账号问题是怎么解决的?我一个账号抓 300+条数据就被 ban
funtanstic
2024 年 2 月 5 日
大佬问题解决了么?账号很容易被 ban
Northxw
2024 年 2 月 6 日
@funtanstic 兄弟,几年前的问题了,我现在已经不搞爬虫了,账号被 ban 就挂代理(真实代理,贵一点的,或者自己维护 ip 池)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/557378

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX