网站: http://music.163.com/#/search/m/?s=%E6%B1%AA%E5%B3%B0
特别说明:只是学习研究,不作它途
想用 PY3 自带的库获取此网站的曲目列表及下载链接
特点: 翻页时网址未改变;上面的(搜索)网址其源码内容上不能反映出搜索结果(即歌曲列表);
这是 AJAX 吗,应如何爬取?
1
freejishu Apr 29, 2016
网易家的早做加密了。 ajax 一点也不假,但是你需要破译那些密文。据说解密 js 是动态生成的
|
2
Hello1995 Apr 29, 2016 via Android
趁这个阶段旧的 API (抓包或者 Google 可得) 还可以用,你想尝试就试试吧。新的 API 已经加密了。
|
3
Tink PRO github 上有开源了的 api
|
4
geek123 Apr 29, 2016
|
5
Arrowing Apr 29, 2016
呃,我不久前用 phantomjs 做了一个简单的,代码还乱糟糟的,不过原理是一样的
我看了网易前端的代码是根据前端加密了,估计可以后端配置的,这个不好处理,可能需要经常改动源代码 所以用 phantomjs 模拟用户进入页面把歌曲爬下来。。。 代码详情见: https://github.com/arrowing/ColorPlayer 口下留情呀,谢谢。 :) |
6
Arrowing Apr 29, 2016
语句不通顺,改下:
我看了网易前端的 http 请求代码是根据前端加密了,一般是一些表情的文字,如'大笑','开心'等几个组合作为 salt 加密 |
7
explist OP 通过播放一首歌查了下其下载地址:与打开时间相关,链接中有 MD5 值
|
8
soulgeek Apr 29, 2016
you-get 不知道现在还能不能抓网易家的了 https://you-get.org/
|
9
Allianzcortex Apr 29, 2016
用 API 拿到 json 数据然后解析
|
10
Allianzcortex Apr 29, 2016
还有,题目如果改成“如何用 py 爬网易云音乐”的话应该能吸引更多的人~
|
11
explist OP 怕引来网易的关注,嘿嘿
|
13
mgna17 Apr 29, 2016
pyuserinput + 录音 (逃
|
14
Hxai11 May 9, 2016
表示只爬过网易的专辑图片,爬了 18g 的图片,我觉得我好无聊哈哈哈
|