V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wisefree  ›  全部回复第 11 页 / 共 16 页
回复总数  315
1 ... 3  4  5  6  7  8  9  10  11  12 ... 16  
2017-04-02 17:39:13 +08:00
回复了 wisefree 创建的主题 Python 第二篇爬虫文章来了,只不过是前传
@jimmy66 好的,我会根据反馈情况不断修正文章的更新进度
2017-04-02 17:38:37 +08:00
回复了 wisefree 创建的主题 Python 第二篇爬虫文章来了,只不过是前传
@zjhui 等我写完正则。。。或者可以投稿把正则这个坎绕过去
2017-04-02 17:38:31 +08:00
回复了 wisefree 创建的主题 Python 第二篇爬虫文章来了,只不过是前传
@Merlini 嗯,等我写完正则。。。或者可以投稿把正则这个坎绕过去
2017-04-02 15:28:58 +08:00
回复了 wisefree 创建的主题 Python 第二篇爬虫文章来了,只不过是前传
@WildCat 正则写完就写代理池。当然还要看正则这篇文章的反馈情况,:)
2017-04-02 15:06:33 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@AkiseAru 差不多的,有 Python 基础就可以看,刚刚发布了第二篇, https://www.v2ex.com/t/352150
2017-04-02 15:06:01 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@onelove 哈哈,赶紧写了第二篇, https://www.v2ex.com/t/352150
2017-04-02 08:16:23 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@wellhome 好问题!
爬取网页多的情况下,并不知道会出现什么样的异常,除非对网站十分熟悉。那么换一种思路,按绝大多数的正常网页来编写爬虫程序,其余的用 try except 处理。

最后对极少数的异常网页,做特殊处理。

这是我的思路,欢迎交流

(如果楼主愿意写些爬虫文章,欢迎投稿哈)
2017-04-01 23:26:52 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@mingyun 果然也是老司机。确实是用 wordcloud 做的
2017-04-01 22:48:02 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@wellhome 不用客气的,欢迎交流

保证程序连续运行,是什么情况?能描述一个具体的实例么?

我使用的是多进程
2017-04-01 20:06:57 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@kingcos 谢谢,真的欢迎投稿,感觉自己挖了个大坑
2017-04-01 20:06:12 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@fffflyfish 有文章讲讲这方面的知识吗?
同时欢迎 V 友投稿
2017-04-01 19:40:35 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
刚看到一个 V 友也在写爬虫文章,选择的平台也是简书。(在 Python 这个节点靠前的位置)

他是从零入门的,而我这个不是从零入门的,基础知不会讲到。想想还,真是有缘,哈哈
2017-04-01 19:34:28 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@kancloud 好的,我会关注这个平台的,:)
2017-04-01 18:00:34 +08:00
回复了 wisefree 创建的主题 Android fiddler 如何抓取安卓手机的流量包
@Akkuman 谢谢推荐!
2017-04-01 16:17:22 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@cheese 好的,已经 ok 了。多交流哈,欢迎投稿,哈哈
2017-04-01 16:08:29 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@cheese 已经更正,文章第一行有更新信息,加了你的 V2EX 主页链接,如果可能对你造成影响,请告诉我,我立即清除
2017-04-01 14:56:58 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@Or2 水到渠成的时候,可能会写的。如果把这些知识点写完,只要结合几个知识点,那么就可以写出高级爬虫的例子了,:)
2017-04-01 13:28:56 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@anexplore 也不一定,我寝室一个哥们转行 java ,让他写爬虫,死活不写,还是看个人兴趣。。:)
2017-04-01 13:27:17 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@xzpjerry731 谢谢提建议,暂时不打算到 github 维护文章,因为要写毕业论文,:(
2017-04-01 13:10:06 +08:00
回复了 wisefree 创建的主题 Python 开始在简书上写 Python 爬虫系列文章
@xiaoke0718 我爬取过高考吧 200 多万条记录,用里上面写大部分技术,爬网易云课堂评论的时候用过 selenium
http://www.jianshu.com/p/8893973b279c
虽然代码写的不漂亮,但是能干活。
1 ... 3  4  5  6  7  8  9  10  11  12 ... 16  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1170 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 18:14 · PVG 02:14 · LAX 10:14 · JFK 13:14
Developed with CodeLauncher
♥ Do have faith in what you're doing.