V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
CaptainD
V2EX  ›  问与答

scrapy 反爬问题

  •  
  •   CaptainD · Nov 29, 2021 · 1147 views
    This topic created in 1613 days ago, the information mentioned may be changed or developed.

    我用 scrapy 写了一个爬虫,爬一些国外公共网站的内容,之前工作正常,但这周一发现页面返回内容出错,状态码是 200 ,但是返回的内容是错误的,怀疑是爬虫被识别了

    这类的公共网站一般没有什么反爬,之前做的反爬手段只有模拟浏览器头,设置一下 delay 之类的,没有使用代理,这种可以确定是反爬手段吗,大家有什么好的解决方式吗

    2 replies    2021-11-29 13:45:59 +08:00
    xiao109
        1
    xiao109  
       Nov 29, 2021
    那就上代理呗,反正反爬和反反爬大家来来回回也就那三板斧
    CaptainD
        2
    CaptainD  
    OP
       Nov 29, 2021
    @xiao109 代理也不是没用过,免费的不好用,收费的有点贵
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5538 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 06:41 · PVG 14:41 · LAX 23:41 · JFK 02:41
    ♥ Do have faith in what you're doing.