studyaa 最近的时间轴更新
studyaa

studyaa

V2EX 第 309656 号会员,加入于 2018-04-18 16:52:19 +08:00
在线求助!现有一个校园共享单车系统
 •  studyaa  •  2021-06-27 21:06:47 PM  •  最后回复来自 falcon05
15
请教一下 scrapy 爬取数据不完整的问题
  •  1   
    问与答  •  studyaa  •  2019-07-08 16:24:36 PM  •  最后回复来自 studyaa
    2
    想讨论一下关于识别图片效率的问题
    问与答  •  studyaa  •  2019-01-17 14:35:55 PM  •  最后回复来自 megamilk
    2
    请教一下关于 jTessBoxEditor 训练字体的问题
    问与答  •  studyaa  •  2019-01-11 12:29:12 PM  •  最后回复来自 studyaa
    2
    studyaa 最近回复了
    2019-07-08 16:24:36 +08:00
    回复了 studyaa 创建的主题 问与答 请教一下 scrapy 爬取数据不完整的问题
    @qianyin123 json.decoder.JSONDecodeError: Unterminated string starting at: line 1 column 13042 (char 13041)就这个错啊 json 数据不完整导致的
    2019-01-11 12:29:12 +08:00
    回复了 studyaa 创建的主题 问与答 请教一下关于 jTessBoxEditor 训练字体的问题
    @ljspython 不会啊==大兄弟有没有例子啥的发个链接
    @ToT 嗯嗯! 我看看
    @summerwar 每天需要大概五六个小时跑几千万数据, 会用到 selenium
    服务器的配置也跟所需代理 ip 有关吗?
    对服务器不太懂
    为什么都需要在服务器上跑爬虫

    感谢之前的回答!
    @msg7086
    五六个小时要跑几千万数据,
    ip 肯定要频繁换,多少个的话我也不太清楚怎么算,一个首页面一个?几十万个?
    分布式不太懂
    国外的不需要
    价钱的话公司没说,就说做下来所需要的配置..

    还有感谢回答!
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2572 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 15ms · UTC 10:39 · PVG 18:39 · LAX 02:39 · JFK 05:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.