V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ljcarsenal
V2EX  ›  程序员

微信公众号历史文章获取?

  •  
  •   ljcarsenal · 2014-11-14 15:12:46 +08:00 · 13866 次点击
    这是一个创建于 3670 天前的主题,其中的信息可能已经有所发展或是发生改变。
    知道有个传送门网站,但那个网站似乎不稳定(对爬虫来说,很容易503)。我们决定自己做个爬取微信公众号文章的站。首先要获得某个公众号的具体历史文章列表。这个可以通过微信上查看历史文章获取,然后抓包分析,获取了一定的效果。现在知道 url getmasssendmsg?__biz=MjM5NDM3MDQwMA==&uin=MTM1OTY1NzgyMA%3D%3D&key=1d3004ed55a8e3866db43e981efca321ea995610a3e118f8e873edc416d2e4ced7c42ec56d8ec12591ddbf188f8678f7&devicetype=android-17&version=26000032&lang=zh_CN&pass_ticket=QBqGJE4KnmXPpjLqhheqoycmRWzt0IiDkxKOfkSHk06ZjRoVHEmwS0OM2p7DhJaF
    这样的结构。biz参数是每个号独有的,key似乎也不一样。但找不到规律。。
    不知道传送门是怎么获取那么多文章链接的?
    8 条回复    2020-01-08 16:19:41 +08:00
    crab
        1
    crab  
       2014-11-14 15:19:27 +08:00
    ljcarsenal
        2
    ljcarsenal  
    OP
       2014-11-14 15:38:25 +08:00
    @crab 经过我对比,搜狗这个好多账号查不到,还没有传送门的全
    deben
        3
    deben  
       2014-11-14 20:10:53 +08:00
    @crab sogou 干掉了我的 IP 这条路不太好走
    确切说是腾讯干掉的,搜狗的公众号搜索结果,是用 js 从微信那边取来的
    yepinf
        4
    yepinf  
       2015-04-23 11:57:30 +08:00
    @deben
    “搜狗的公众号搜索结果,是用 js 从微信那边取来的”,应该是有私密的接口吧

    @ljcarsenal
    楼主历史文章获取进展如何?
    yepinf
        6
    yepinf  
       2015-05-14 13:34:33 +08:00
    @ljcarsenal

    这个能实现吗?我测试到301跳转那一步,不能返回数据啊
    好囧:D
    qhservice1024
        7
    qhservice1024  
       2019-08-14 20:02:20 +08:00
    http://www.qianhaikeji.cn,文档导出助手一键搞定
    vow
        8
    vow  
       2020-01-08 16:19:41 +08:00
    哭, 我也在想这个 key 该怎么算出来
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2853 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 12:07 · PVG 20:07 · LAX 04:07 · JFK 07:07
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.