如果你想学习 scrapy 爬虫开发,或许它能帮到你

2016 年 12 月 6 日
 MichaelYin

如果你想学习 scrapy 爬虫开发,或许它能帮到你

大家好,我是 michael ,现在居住在水电之城宜昌,从事远程开发已经三年多了,主要用 python 进行爬虫开发,数据可视化工具开发。一直以来 python 社区并没有一份比较好的爬虫入门教程,免费的更少,所以我决定来试着解决这个痛点。

这个项目包含

  1. 一份任务列表,这份任务列表包含了爬虫开发过程中的一些基本知识点,每一个任务都是一个小的测验,当你循序渐进的完成了这个任务列表中的任务时,你将有能力面对爬虫实际开发过程中一些更复杂的情况。这个任务列表的创意来自 codekata

  2. 一份爬虫开发过程中的注意事项和笔记,这些笔记能有效提高你的开发效率,还会介绍一些非常有用的工具

项目已经托管在 github, 关于这个项目更多的信息请戳 这里

5142 次点击
所在节点    程序员
19 条回复
lakeview
2016 年 12 月 6 日
谢谢,先看看
fengxueshangu
2016 年 12 月 6 日
支持一下楼主,公司电脑不能 pip ,安装起来简直要了我老命
pscl
2016 年 12 月 6 日
支持,先看看
zhangchioulin
2016 年 12 月 6 日
支持支持
KenGe
2016 年 12 月 6 日
支持 我先看看 最近在学习
GreatMartial
2016 年 12 月 6 日
支持
hebwjb
2016 年 12 月 6 日
支持
cankoor
2016 年 12 月 6 日
有心,支持!
jingliang
2016 年 12 月 6 日
chendajun
2016 年 12 月 6 日
有心,兹磁!
fhefh
2016 年 12 月 6 日
先 mark
songjiaxin2008
2016 年 12 月 6 日
前几天直接学 scrapy 爬了下 javlibrary...这个库很强大,对于错误处理以及存储都很方便,就是感觉文档有的东西不是很新呀,都得自己踩完了才能发现,比如 log 库,以及包引入(contribe)。
ammzen
2016 年 12 月 6 日
@songjiaxin2008 分词搞错了,当成 javlibrary 这个库很强大,去搜了一下[掩面而逃(*/ω╲*)]
zhanghaoteng
2016 年 12 月 6 日
支持 lz ,感谢
flyingghost
2016 年 12 月 6 日
@ammzen javlibrary 这个库很强大毫无破绽啊。😂
publicAdmin
2016 年 12 月 6 日
已 fork ,感谢,感谢!🙏
alexapollo
2016 年 12 月 6 日
@songjiaxin2008
@flyingghost
你们竟然在这里讨论这么神圣而不可侵犯的库
blaxing
2016 年 12 月 6 日
楼主有心了,谢谢您的付出。
zypy333
2016 年 12 月 7 日
@songjiaxin2008 我还以为是 java...学习了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/325560

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX