V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
xinyana
V2EX  ›  分享创造

Google Drive 搜素引擎-重大升级

  •  1
     
  •   xinyana · 2020-10-15 14:28:37 +08:00 · 4843 次点击
    这是一个创建于 1261 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Google Drive 搜素引擎-重大升级

    各种 VIP 原 ZhaoPP,可搜索 google drive 的文件,并且可直接下载

    GIthub 地址: https://github.com/gdtool/zhaopp

    原来的爬虫只爬一次,新文件不能包含

    一.爬虫升级

    本次升级主要更新了爬虫部分,10 分钟内爬完 90 个团队盘的新文件

    目前已经收录了 94 个团队盘,资源大小更是达到了 6P(6000T)

    在此感谢那些无私奉献团队盘的网友

    so ,如果你有好多好多资源,可以用本工具索引你的团队盘,加速搜索,利人利己

    二.求推荐

    本工具完全免费,但是流量过大,甚至有的论坛直链分享下载,日均 5T 流量

    100T 流量的 VPS 几天就用完,

    特来求一个不限流量的 G 口 VPS,非常感谢

    第 1 条附言  ·  2020-10-15 19:04:59 +08:00
    更新 GIthub 地址:
    https://github.com/gdtool/zhaopp
    31 条回复    2020-11-03 13:50:53 +08:00
    zqjilove
        1
    zqjilove  
       2020-10-15 14:41:38 +08:00
    很想问问,每日访问怎样,方便说的话?
    Clash
        2
    Clash  
       2020-10-15 14:42:37 +08:00
    前几天才在站内了解到 ZhaoPP,试了下觉得很不错,能搜 google drive 资源。
    但是使用过程中有个不爽的地方,就是我想找某方面的教程,通过搜索找到了一套视频教程,但我只能下载当前搜到的,从那个显示出来的路径里看,这套教程还有很多个视频,第 1 章到第 N 章文件夹分得清清楚楚,可我就是不能一下找到,甚至我因为不知道其他章节的文件的名称,我可能都无法找全这套教程。
    所以我感觉这个给贡献资源者自己用还不错,对非贡献资源者其实并不友好。

    这可能是为了鼓励贡献资源而这么设计的,也可能是技术所限,或者其他原因,不太了解,以上仅是一点使用感受罢了。
    lostberryzz
        3
    lostberryzz  
       2020-10-15 14:44:58 +08:00
    G 口不限流量的 VPS 不多见,G 口的独服挺多的
    xinyana
        4
    xinyana  
    OP
       2020-10-15 14:51:35 +08:00
    @Clash 你可以搜完整路径 就像这样: / [编号 19] 北京精雕全套+教程+素材 / 教程 / 实用教程 / 蓝月阁最新整理精雕教程 / 杂项教程 / 精雕 VIP 有声教程教程 /
    DoctorCat
        5
    DoctorCat  
       2020-10-15 14:51:57 +08:00
    这么大流量,可以考虑独服了,不然存在被 ban 的风险
    xinyana
        6
    xinyana  
    OP
       2020-10-15 14:58:21 +08:00
    @zqjilove 这个没什么的
    ![2020-10-15_145612.png]( https://i.loli.net/2020/10/15/6HArvTM1zfZ3KwV.png)
    dovme
        7
    dovme  
       2020-10-15 16:06:52 +08:00 via iPhone
    Nb! B
    Clash
        8
    Clash  
       2020-10-15 17:13:51 +08:00
    @xinyana #4 好的,谢谢。
    Latin
        9
    Latin  
       2020-10-15 17:18:50 +08:00
    好评 麻豆
    xinyana
        10
    xinyana  
    OP
       2020-10-15 17:22:26 +08:00 via Android
    @Latin 咱不能搜点正能量的?[捂脸]
    SingeeKing
        11
    SingeeKing  
       2020-10-15 18:12:24 +08:00
    github 404 了……
    xinyana
        12
    xinyana  
    OP
       2020-10-15 18:14:48 +08:00 via Android
    @SingeeKing 网址最后多了一个 p,不会修改
    SingeeKing
        13
    SingeeKing  
       2020-10-15 18:15:21 +08:00
    这……
    Latin
        14
    Latin  
       2020-10-15 18:27:20 +08:00
    @xinyana 哈哈哈
    Latin
        15
    Latin  
       2020-10-15 18:27:51 +08:00
    @xinyana 加个附言
    zitup
        16
    zitup  
       2020-10-15 19:07:36 +08:00
    谢谢作者,已收藏
    IllBeBack
        17
    IllBeBack  
       2020-10-15 20:34:19 +08:00
    为什么会这么大流量,下载的东西不是在 GDrive 上吗,通过你们做中转了?
    xinyana
        18
    xinyana  
    OP
       2020-10-15 21:12:03 +08:00 via Android
    @IllBeBack 我要是说纯 html 这个流量,你信不信?😂
    baoshuo
        19
    baoshuo  
       2020-10-15 21:15:24 +08:00   ❤️ 1
    hetzner 的独服应该可以,不考虑速度的话不贵
    cjzlol
        20
    cjzlol  
       2020-10-15 21:19:22 +08:00 via Android
    这流量,牛逼
    jackrebel
        21
    jackrebel  
       2020-10-16 14:56:09 +08:00
    一个非常牛逼的工具, 我不小心下载了。。。一些葫芦娃电影
    superchange
        22
    superchange  
       2020-10-16 17:25:40 +08:00
    @SingeeKing 哈哈哈哈和和
    nicoljiang
        23
    nicoljiang  
       2020-10-16 18:15:45 +08:00
    这些有版权问题的内容 Google 不会删吗?
    另:你的 CDN 缓存率看起来几乎为 0%,当然浪费 VPS 的流量。
    aaronlam
        24
    aaronlam  
       2020-10-17 14:59:30 +08:00
    @xinyana 看样子应该是下载的东西都通过 cloudflare worker 进行中转的呀。。所以流量才会这么大的把。。
    xinyana
        25
    xinyana  
    OP
       2020-10-17 15:12:10 +08:00
    @nicoljiang
    @aaronlam cdn 用的 cf,比较省心,下载站缓存率确实低
    tomemi
        26
    tomemi  
       2020-10-19 16:24:10 +08:00
    已收藏
    opooooos
        27
    opooooos  
       2020-10-21 14:24:40 +08:00
    好奇一个问题。
    网站搜索引索有个 222t,点进去第一页的所有链接都无法访问或者被限制。
    这个到底是什么呢?
    madlifer
        28
    madlifer  
       2020-10-21 15:37:11 +08:00
    下一步是否要添加内容重识别? 搜个内容很多全部都是一致的,只是分布在不同的盘里
    xinyana
        29
    xinyana  
    OP
       2020-10-21 22:57:10 +08:00
    @opooooos 这个盘太火,超配额了
    xinyana
        30
    xinyana  
    OP
       2020-10-21 22:57:34 +08:00
    @xinyana 同上,超配额后换个盘下
    fuxkcsdn
        31
    fuxkcsdn  
       2020-11-03 13:50:53 +08:00
    @xinyana

    老哥,我大致看了下,*.pp.ua 的域名你都是用来走下载的,而据我了解,这个下载根本不走 vps 不是

    如果按 18# 你说的纯 html 流量有 5T/天,我算了下
    首页 压缩传输后有 960B,一次搜索大概 1.7KB (压缩后),也就是说从打开首页到一次搜索大概就是 2.6KB (压缩后)
    5T / 2.6KB /86400 平均每秒 23900 次请求(实际是 2 次请求,一次首页加一次搜索,所以这里还要乘 2 )
    你说纯 html 流量,我是不信的,你 github 上的那截图里用的 zhao.pp.ua 域名,明显只是用来中转 gdrive 的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3722 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 10:23 · PVG 18:23 · LAX 03:23 · JFK 06:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.