V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
h175h32
V2EX  ›  站长

怎么才能把自动变换 user-agent 的爬虫拉黑呢

  •  
  •   h175h32 · Mar 3, 2025 · 2516 views
    This topic created in 422 days ago, the information mentioned may be changed or developed.

    现在有很多自动变换 user-agent 的爬虫,每次访问页面都会换一次 ua ,怎么才能把他们自动拉黑呢,这些爬虫把服务器带宽都占满了

    13 replies    2025-03-04 09:37:24 +08:00
    hubaq
        1
    hubaq  
       Mar 3, 2025
    V2:上 CF
    Hookery
        2
    Hookery  
       Mar 3, 2025
    这种情况找到对方可以走法律途径起诉。前提是能找到。
    deplives
        3
    deplives  
       Mar 3, 2025
    换个思路,套一个 cf 吧
    h175h32
        4
    h175h32  
    OP
       Mar 3, 2025
    @deplives 套 cf 晚上卡的飞起啊。
    blackeeper
        5
    blackeeper  
       Mar 3, 2025
    ua 变化,IP 又不会变化,根据 IP 来做策略就可以了
    voidcomma
        6
    voidcomma  
       Mar 3, 2025
    上 recapture (…
    h175h32
        7
    h175h32  
    OP
       Mar 3, 2025
    @blackeeper 难就难在 怎么判断他是有多个 ua
    sslyxhz
        8
    sslyxhz  
       Mar 3, 2025
    ip 策略,登录限制
    Lshl56B4vDqdixwK
        9
    Lshl56B4vDqdixwK  
       Mar 3, 2025
    看看有什么特征吧,爬虫一般用的是 http 1.1 ,干脆把所有 http 1.1 除搜索引擎爬虫的请求全部验证码质询。
    herozzm
        10
    herozzm  
       Mar 4, 2025 via iPhone
    ua 和 ip 都会变就无解,上验证码
    zeusho871
        11
    zeusho871  
       Mar 4, 2025
    基于 tls 指纹可以拦截一部分,然后麻烦的需要用 ip 加行为风控
    Dragonish3600
        12
    Dragonish3600  
       Mar 4, 2025
    直接屏蔽所有云厂商的 CIDR
    h175h32
        13
    h175h32  
    OP
       Mar 4, 2025
    @ladypxy 你这个办法比较好 CIDR 不知道哪里有
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1016 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 65ms · UTC 22:09 · PVG 06:09 · LAX 15:09 · JFK 18:09
    ♥ Do have faith in what you're doing.