其实。。。还没有发布,先做个调查
原理很简单,无非就是请求一下文章地址,然后解析 HTML ,把文章内容提取处理后再导入
前段时间因为要爬取大量的公众号文章,用了朋友在 GitHub 上写的微信公众号爬虫 (基于中间人攻击的爬虫核心实现,支持批量爬取公众号所有历史文章)项目,但是爬取完之后需要对这些文章进行处理,而我用的是 Wordpress 搭建的项目,所以为了方便就自己写了一个简单的插件,之前因为只是自己用,所以界面也很简单粗暴,今天开始完善,估计这几天可以搞定,下面是基本的界面
深入交流请扫码,爬虫作者也在,对爬虫有兴趣你们也可以找他谈笑风生(无法加入?请加我微信 always-bee)
TIPS:
如果你自己会使用前面提到的爬虫,那么你可以自行导出一份关于公众号所有文章的链接,通过这个插件上传即可一键导入,不过感觉不够自动化,而且对于普通用户来说门槛稍高,后面会逐步完善这个批量导入的功能吧
批量导入并非必须的功能,但如果是想填充网站内容,那么这个插件会很有用,目前我也利用这个插件配合爬虫去填充我的网站内容,当然我没打算做成像传送门那样,我只是做垂直内容,前期批量导入,这样不至于网站初期空荡荡,后面的话隔段时间去搜狗搞一些文章链接定期更新
PS:导入别人的文章有版权问题,这个插件无法解决
目前试用版已经出来,欢迎试用
微信公众号文章插件for WordPress
目前已经上线啦,直接在插件面板搜索 BeePress 即可
更多使用介绍可以看 这篇文章
1
designer 2017-03-14 15:11:11 +08:00 via iPhone 1
如果可以公众号和 wordpress 博客能够保持同步更新更好啦。
会推荐给更多的朋友用。 |
2
designer 2017-03-14 15:11:26 +08:00 via iPhone
已加入!
|
3
Majirefy 2017-03-14 15:13:37 +08:00
做个双向的~既能导入也能导出,双向,即楼上说的同步。
自己每次完成文章之后手动粘贴到微信号往往苦不堪言…… |
5
wujunze 2017-03-14 15:55:23 +08:00
不错 赞一个
|
6
AlwaysBee OP 哈哈,感谢支持,这段时间把它搞定
|
9
AlwaysBee OP @maleigebi 如果确实有这个需求,肯定会有的,可能是我,也可能是别的开发者去实现。。。哈,可以扫一下二维码在群里交流一下,以后插件发布了也会第一时间通知
|
10
binjoo 2017-03-14 16:26:03 +08:00
前两天才看到水煮鱼的博客发了这个类似的文章。
http://blog.wpjam.com/project/wpjam-grabmp/ |
11
AlwaysBee OP @binjoo 去看了一下,大体功能是类似的吧,其实导入文章是很简单的,关键是一些特别的需求,要结合一些别的工具来实现(比如爬虫),批量爬取公众号所有文章
另外,水煮鱼 这篇文章它的机器人才是关键。。。。 |
12
Famio 2017-03-14 17:48:15 +08:00
一切的 wp 插件我都支持,已下载试用,感谢
|
14
Faratv2 2017-03-14 19:31:07 +08:00
|
15
woorz 2017-03-15 09:05:37 +08:00
|
17
uzumaki 2017-03-15 12:31:56 +08:00
有需求我公众号上有一堆文章 又懒得转博客
|
22
liangjing414 2017-03-15 16:36:15 +08:00
兄弟,我很需要你这种插件,现在我的网站 www.yeoner.com 其中有个自媒体栏目,现在是在外面找了一个插件 接入了 100 多家的公众号,爬虫自动爬取文章,自动发布到网站,但一切都是放在别人机器上运行的,期待你这款插件,甚至问问:我可以付费订制一些细节功能吗?联系 马化腾 810-800-918
|
23
yws112358 2017-03-15 17:57:57 +08:00
只想问:能把图片本地化吗
|
25
AlwaysBee OP 你这个插件已经比我的厉害了
|
26
AlwaysBee OP @liangjing414 #25
|
27
Damaidaner 2017-03-16 09:46:18 +08:00
感谢分享! Mark 一下,以后备用!
|
28
AlwaysBee OP @woorz 这个插件其实只是为了方便手动提交文章链接然后插入文章的,批量导入是需要自行采集的(利用爬虫等工具),这一块我自己还不能实现完全的自动化(主要是因为要关注公众号才能爬取),我自己用的话倒无所谓,期间还需要点人工介入,你可以加入爬虫作者的群去了解一下,目前他可以实现自动关注公众号,但这一块功能还未开源出来
@Damaidaner 感谢关注,希望能够尽快做出来 |
29
orzz 2017-03-26 00:15:01 +08:00 via Android
给 typecho 写个吧 多谢
|
30
AlwaysBee OP |
31
bios12567496 2017-07-17 16:13:39 +08:00
mark 多謝
|
32
AlwaysBee OP BeePress 已经更新到了 2.4.0 版本,支持自动同步公众号文章,并提供采集所有历史文章服务
|