V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
tohearts
V2EX  ›  程序员

想请问下大家,有没有什么方法能判别网站所包含的网站总数

  •  
  •   tohearts · Jul 29, 2019 · 1545 views
    This topic created in 2466 days ago, the information mentioned may be changed or developed.

    想对某一个网站较快的方法得出其网站链接总数。

    sleepm
        1
    sleepm  
       Jul 29, 2019   ❤️ 1
    在谷歌中 site:site.domain
    在网页中找 sitemap.xml
    找网站所使用的程序,举个例子,比如文章列表页,多少个目录,一页多少个,共多少,累加
    得到完全具体的数字数字那是不可能的,自己建的站都不知道多少链接。。。。
    silencefent
        2
    silencefent  
       Jul 29, 2019
    开个爬虫,一级域名通配符一页页抓 url,放 redis 里面用布隆过滤器去重
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1017 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 19:21 · PVG 03:21 · LAX 12:21 · JFK 15:21
    ♥ Do have faith in what you're doing.