可以爬取文章的标题、头图、正文、作者名称、作者头像、摘录。
支持将爬取的数据保存到数据库,并将图片上传到对象存储,替换原来的图片链接。
如果对您有帮助的话,请点个 star,谢谢啦。
1
zdb1115 2019-02-21 13:04:03 +08:00
点了 star,谢谢分享。
|
3
DoraMouse 2019-02-21 14:54:17 +08:00 via iPhone
已 start
|
4
jisibencom 2019-02-21 16:34:32 +08:00 via Android
这个还有通用的?每个采集点结构不同吧。。。还没用
|
5
omph 2019-02-21 17:07:06 +08:00
定位为小工具,为了保持通用,简单的单文件可能更好
|
7
roothub OP @jisibencom 根据配置的 DOM 来采集的
|
9
luckbbs 2019-02-22 07:19:01 +08:00
已 start
|