爬虫爬到的大量图片是直接放到数据库中还是放到文件系统中?

2013 年 7 月 26 日
 shoumu
9959 次点击
所在节点    程序员
30 条回复
manoon
2013 年 7 月 28 日
@shoumu goodidea!
Alexisused
2013 年 7 月 28 日
@shoumu 最近压力大啊 都是加班的节奏 没心思爬 靠你了
lewisc402
2013 年 7 月 28 日
咨询下LZ 用的是什么样的爬虫啊??是基于scrapy这样的框架的基础上的?还是全部自己写的?
xinrui5577
2013 年 7 月 29 日
求楼主的代码。。我也想要一个。
4BVL25L90W260T9U
2013 年 7 月 29 日
很早之前爬过煎蛋妹子图,过了好久了,再爬一次试试
cevincheung
2013 年 7 月 29 日
mongodb路过
xdyl
2013 年 7 月 30 日
FastDFS
cxshun
2013 年 7 月 30 日
@Alexisused 哈哈,这个好想法,这段时间正好在想有啥东西可以去做做,构思一下。
wodemyworld
2013 年 7 月 30 日
请扔mongodb,分布式存储,这对将来的分析和综合都有好处,要不以后改起来的话能头痛死你

以往的做法是,每张图片有很多的tag,全靠tag来提供信息,检索、分类等都有很好的效果,当然了,前提是你已经有tag系统了,这个你要是没有的话就先别做了,这个工作量不小~
Alexisused
2013 年 7 月 31 日
@cxshun 好好搞 骚年 我坐等现成的了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/77068

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX