V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
爱意满满的作品展示区。
xinyana

Google Drive 搜素引擎-重大升级

  •  1
     
  •   xinyana · Oct 15, 2020 · 5519 views
    This topic created in 2020 days ago, the information mentioned may be changed or developed.

    Google Drive 搜素引擎-重大升级

    各种 VIP 原 ZhaoPP,可搜索 google drive 的文件,并且可直接下载

    GIthub 地址: https://github.com/gdtool/zhaopp

    原来的爬虫只爬一次,新文件不能包含

    一.爬虫升级

    本次升级主要更新了爬虫部分,10 分钟内爬完 90 个团队盘的新文件

    目前已经收录了 94 个团队盘,资源大小更是达到了 6P(6000T)

    在此感谢那些无私奉献团队盘的网友

    so ,如果你有好多好多资源,可以用本工具索引你的团队盘,加速搜索,利人利己

    二.求推荐

    本工具完全免费,但是流量过大,甚至有的论坛直链分享下载,日均 5T 流量

    100T 流量的 VPS 几天就用完,

    特来求一个不限流量的 G 口 VPS,非常感谢

    Supplement 1  ·  Oct 15, 2020
    更新 GIthub 地址:
    https://github.com/gdtool/zhaopp
    31 replies    2020-11-03 13:50:53 +08:00
    zqjilove
        1
    zqjilove  
       Oct 15, 2020
    很想问问,每日访问怎样,方便说的话?
    Clash
        2
    Clash  
       Oct 15, 2020
    前几天才在站内了解到 ZhaoPP,试了下觉得很不错,能搜 google drive 资源。
    但是使用过程中有个不爽的地方,就是我想找某方面的教程,通过搜索找到了一套视频教程,但我只能下载当前搜到的,从那个显示出来的路径里看,这套教程还有很多个视频,第 1 章到第 N 章文件夹分得清清楚楚,可我就是不能一下找到,甚至我因为不知道其他章节的文件的名称,我可能都无法找全这套教程。
    所以我感觉这个给贡献资源者自己用还不错,对非贡献资源者其实并不友好。

    这可能是为了鼓励贡献资源而这么设计的,也可能是技术所限,或者其他原因,不太了解,以上仅是一点使用感受罢了。
    lostberryzz
        3
    lostberryzz  
       Oct 15, 2020
    G 口不限流量的 VPS 不多见,G 口的独服挺多的
    xinyana
        4
    xinyana  
    OP
       Oct 15, 2020
    @Clash 你可以搜完整路径 就像这样: / [编号 19] 北京精雕全套+教程+素材 / 教程 / 实用教程 / 蓝月阁最新整理精雕教程 / 杂项教程 / 精雕 VIP 有声教程教程 /
    DoctorCat
        5
    DoctorCat  
       Oct 15, 2020
    这么大流量,可以考虑独服了,不然存在被 ban 的风险
    xinyana
        6
    xinyana  
    OP
       Oct 15, 2020
    @zqjilove 这个没什么的
    ![2020-10-15_145612.png]( https://i.loli.net/2020/10/15/6HArvTM1zfZ3KwV.png)
    dovme
        7
    dovme  
       Oct 15, 2020 via iPhone
    Nb! B
    Clash
        8
    Clash  
       Oct 15, 2020
    @xinyana #4 好的,谢谢。
    Latin
        9
    Latin  
       Oct 15, 2020
    好评 麻豆
    xinyana
        10
    xinyana  
    OP
       Oct 15, 2020 via Android
    @Latin 咱不能搜点正能量的?[捂脸]
    SingeeKing
        11
    SingeeKing  
    PRO
       Oct 15, 2020
    github 404 了……
    xinyana
        12
    xinyana  
    OP
       Oct 15, 2020 via Android
    @SingeeKing 网址最后多了一个 p,不会修改
    SingeeKing
        13
    SingeeKing  
    PRO
       Oct 15, 2020
    这……
    Latin
        14
    Latin  
       Oct 15, 2020
    @xinyana 哈哈哈
    Latin
        15
    Latin  
       Oct 15, 2020
    @xinyana 加个附言
    zitup
        16
    zitup  
       Oct 15, 2020
    谢谢作者,已收藏
    IllBeBack
        17
    IllBeBack  
       Oct 15, 2020
    为什么会这么大流量,下载的东西不是在 GDrive 上吗,通过你们做中转了?
    xinyana
        18
    xinyana  
    OP
       Oct 15, 2020 via Android
    @IllBeBack 我要是说纯 html 这个流量,你信不信?😂
    baoshuo
        19
    baoshuo  
       Oct 15, 2020   ❤️ 1
    hetzner 的独服应该可以,不考虑速度的话不贵
    KHfqLAYYS6BKJT3R
        20
    KHfqLAYYS6BKJT3R  
       Oct 15, 2020 via Android
    这流量,牛逼
    jackrebel
        21
    jackrebel  
       Oct 16, 2020
    一个非常牛逼的工具, 我不小心下载了。。。一些葫芦娃电影
    superchange
        22
    superchange  
       Oct 16, 2020
    @SingeeKing 哈哈哈哈和和
    nicoljiang
        23
    nicoljiang  
    PRO
       Oct 16, 2020
    这些有版权问题的内容 Google 不会删吗?
    另:你的 CDN 缓存率看起来几乎为 0%,当然浪费 VPS 的流量。
    aaronlam
        24
    aaronlam  
       Oct 17, 2020
    @xinyana 看样子应该是下载的东西都通过 cloudflare worker 进行中转的呀。。所以流量才会这么大的把。。
    xinyana
        25
    xinyana  
    OP
       Oct 17, 2020
    @nicoljiang
    @aaronlam cdn 用的 cf,比较省心,下载站缓存率确实低
    tomemi
        26
    tomemi  
       Oct 19, 2020
    已收藏
    opooooos
        27
    opooooos  
       Oct 21, 2020
    好奇一个问题。
    网站搜索引索有个 222t,点进去第一页的所有链接都无法访问或者被限制。
    这个到底是什么呢?
    madlifer
        28
    madlifer  
       Oct 21, 2020
    下一步是否要添加内容重识别? 搜个内容很多全部都是一致的,只是分布在不同的盘里
    xinyana
        29
    xinyana  
    OP
       Oct 21, 2020
    @opooooos 这个盘太火,超配额了
    xinyana
        30
    xinyana  
    OP
       Oct 21, 2020
    @xinyana 同上,超配额后换个盘下
    fuxkcsdn
        31
    fuxkcsdn  
       Nov 3, 2020
    @xinyana

    老哥,我大致看了下,*.pp.ua 的域名你都是用来走下载的,而据我了解,这个下载根本不走 vps 不是

    如果按 18# 你说的纯 html 流量有 5T/天,我算了下
    首页 压缩传输后有 960B,一次搜索大概 1.7KB (压缩后),也就是说从打开首页到一次搜索大概就是 2.6KB (压缩后)
    5T / 2.6KB /86400 平均每秒 23900 次请求(实际是 2 次请求,一次首页加一次搜索,所以这里还要乘 2 )
    你说纯 html 流量,我是不信的,你 github 上的那截图里用的 zhao.pp.ua 域名,明显只是用来中转 gdrive 的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3593 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 70ms · UTC 11:44 · PVG 19:44 · LAX 04:44 · JFK 07:44
    ♥ Do have faith in what you're doing.