###我想做一个极简的,只是看电影打卡的小程序,目前程序差不多完成 80%,但是一边写一边自我怀疑,爬取豆瓣的信息到底怎么才不违规?和 V 友们讨论一下:
爬取的标题、介绍、片名等都不在 robot 协议限制当中,这个应该是合规的吧?
封面、剧照等图片文件的地址被 robot 协议限制,我如果直接用豆瓣地址显示算违规吗?
我把豆瓣图片 download 下来,上传到自己的 oss 上面算违规吗?
如果违规了,但是我这么小的小程序,会被追究吗?
结合 234 ,如果我只爬 robot 协议限制之外的文字信息,图片什么的使用鼠标人工下载图片,再上传到 oss 上(其实这样和爬虫作用一样,但是我在小程序上声明,所有图片都是人工手动保存并上传的,这样违规吗?)
IMDB 上也不行,而且限制比豆瓣还多。
最后一点,如果怎么都绕不过去,我只爬取 robots 协议里面开放的文字信息,这个肯定没问题吧???
希望大家批评指正。
1
preach Dec 19, 2022 以上问题在你用户量低于 100w 的时候都不是问题,当你有 100w 用户的时候自然能解决,所以放手干吧。
|
2
zxCoder Dec 19, 2022
借楼提问,那如果我用豆瓣的图片,喂给 AI ,“画”出一张类似的图,违规吗 hhh
|
3
ruanimal Dec 19, 2022
https://www.doubanapi.com/. 这个是官方提供的吗
|
4
gaigechunfeng OP @ruanimal 我靠,官方都有啊。 确实很容易就能爬取到。
但是官方这里的图片地址:"http://img6.douban.com/view/photo/cover/public/p1642354684.jpg", 在 robots.txt 里面被 ban 了啊。 官方: 我犯法我自己? |
5
Orciorc Dec 19, 2022 via Android
@gaigechunfeng robot.txt 只是君子协定,真违反了也得看官方的态度,总不会我告我自己吧
|
6
rekulas Dec 19, 2022
doubanapi.com 这看起来可不像官方的,小心别被碰瓷了
|
7
gniviliving Dec 20, 2022
@rekulas 这明显不是官方的,没 https ,还留个 github 地址
|
8
vZexc0m Dec 20, 2022
和豆瓣谈商业合作,获得授权就行了。
|
9
CS50 Dec 20, 2022
用 tmdb https://www.themoviedb.org/
|
10
nekoneko Dec 20, 2022
给豆瓣交钱, 或者给豆瓣画饼, 让他们投资你
|
11
safari9 Dec 20, 2022
@luolw1998 机智,lz 搞几个类似的网站得了不一定非要去爬豆瓣的毕竟豆瓣也不全。图和介绍都可以从 imdb moviedb tvdb 这几个网站搞不一定非要豆瓣。
|
12
fengyueheng Jan 26, 2023
楼主小程序做好了吗
|
13
gaigechunfeng OP @fengyueheng 哈哈,多谢兄弟问了一句。正在做,没停。 做好了,我 at 你试用。
服务端用的 flask ,小程序用的 uniapp ,代码都好说。设计这块我着实有点头疼,想法太多太乱不知道该怎么设计。 |
14
13936 Apr 20, 2023
现在写小程序还能赚钱吗
|
15
gaigechunfeng OP @13936 除了接点外包赚点人工钱。 其它都不赚钱。 我这个是个人爱好。 :D
|
16
TheWire2 9 days ago
@gaigechunfeng 楼主小程序做好了吗?我最近也在做这个类似的,现在卡在获取影视的封面上,我是直接调用 tmdb 的接口,不过国内访问 tmdb 经常抽风,下载不了封面,导致经常获取封面超时。用爬虫担心有风险,准备做个 tmdb 代理来获取影视封面,不知道楼主有没有好的想法
|
17
gaigechunfeng OP @TheWire2 哈哈,做好了。但是没上线,也没用。你可以加我 wx xiaohuopao555
|