用 Scrapy 爬知乎,验证码总是错误。

2014 年 12 月 6 日
 DrakeLeung
我已经获取了验证码图片的地址,然后显示来,并手动输入。

但是验证码还是错误?为什么
8167 次点击
所在节点    Python
11 条回复
bohan
2014 年 12 月 6 日
肯定是提交的有问题啊
DrakeLeung
2014 年 12 月 6 日
@bohan 我看过他的请求,他需要的field,我都传了。有没有可能是加密问题?
22too
2014 年 12 月 6 日
有可能是验证码加密,这个你真没辙,
whywhywhy
2014 年 12 月 6 日
是不是没处理cookie
DrakeLeung
2014 年 12 月 6 日
@whywhywhy 怎么处理cookie?用了帐号密码还需要处理cookie吗
bohan
2014 年 12 月 6 日
如果请求都一样,那有可能就是cookie的问题了
onlyice
2014 年 12 月 7 日
上代码?一起研究下
lfyzjck
2014 年 12 月 9 日
Scrapy应该能自动处理Cookie,每个请求应该都是带上Cookie的,可以开DEBUG看看。

http://doc.scrapy.org/en/latest/topics/downloader-middleware.html#cookies-mw

每次请求获取验证码接口的时候,服务端对应的『正确结果』都会被刷新,所以注意别在提交验证码前再次请求获取验证码
DrakeLeung
2014 年 12 月 9 日
@lfyzjck 你说对了!!好棒!!但是怎样才能显示一个图片出来啊?我现在用的方法是: http://stackoverflow.com/questions/7391945/how-do-i-read-image-data-from-a-url-in-python

但是这种方法就像你所说的,需要再次请求验证码。所以验证码和页面那个不一样了。

所以,有没有其他方法读取HTML里的图片,并显示出来?
DrakeLeung
2014 年 12 月 9 日
@onlyice 好啊。看我回复楼下的。
reloop
2015 年 1 月 28 日
最后 , 问题是怎么解决的?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://study.congcong.us/t/151930

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX