V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
wdssmq
V2EX  ›  分享创造

GM_脚本 + CF Workers KV 半自动收集 B 用户投稿转为 RSS

  •  
  •   wdssmq ·
    wdssmq · 115 天前 · 2771 次点击
    这是一个创建于 115 天前的主题,其中的信息可能已经有所发展或是发生改变。

    终于还是尝试了这种方式什么的。。。

    有借助 RSSHub 订阅 B 站用户投稿和番剧更新,几年来整体还算稳定,想着万一反爬变严了就干脆用 GM_脚本 直接从浏览器里抓取数据到远程存储的方式来实现,,然后 2023-12 开始终于发生了。。。

    就结果来说,本文所述方案的代码已经基本完成了,但是终究是不能自动运行,然后定位上也和标准的 RSS 需求不太一样,,大概还是要研究下给 RSSHub 配置 cookie 。。。

    关于功能定位,对于部分 up 主,会希望能把历史投稿也看一遍,然而总量上就会很多,采取了基于时间和条目序号分页的方案,以 m 天划分周期,当前周期内输出固定的 n 条数据这样,,具体看代码吧。。。

    wdssmq/later-url-cf: 使用 Cloudflare Workers KV 存储服务收集网址并以 RSS 输出;

    https://github.com/wdssmq/later-url-cf

    userscript/packages/later-url at main · wdssmq/userscript

    https://github.com/wdssmq/userscript/tree/main/packages/later-url#readme

    第三部分是过往折腾历程的流水账,博客原文查看

    2 条回复    2024-01-04 16:37:49 +08:00
    zbowen66
        1
    zbowen66  
       115 天前
    直接在脚本里启动浏览器啊,脚本可以定时。搜 playwright
    zbowen66
        2
    zbowen66  
       115 天前
    RssHub 也有内置浏览器版的,我的 RSSHUB 就跑的好好的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3212 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 11:58 · PVG 19:58 · LAX 04:58 · JFK 07:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.