学校让做项目,自己想做个关于电商商品价格浮动的项目,听说频繁抓取会被封 ip ,如果出现这种情况怎么解决
1
lxjsmdc 2016-04-12 13:05:16 +08:00
你就抓现成的那几个已经抓好数据的站就行了
|
2
dong3580 2016-04-12 13:09:00 +08:00
会.
做项目 ? 做成西贴那种 ? 如果是毕设,可以做出来,有个 demo 就行了,没必要一直抓,原理在这儿. |
3
jedyu 2016-04-12 13:35:01 +08:00
第一步应该先去抓
|
4
mahone3297 2016-04-12 13:39:14 +08:00
@lxjsmdc 我擦,好思路。现成抓好数据的站,会公开数据?
|
5
binbinyouliiii OP |
6
binbinyouliiii OP @dong3580 不是网页,是给安卓客户端当服务器的,不过差不多,淘宝我是不敢想了,觉得自己抓抓京东易迅什么的就可以,你说我抓那个西贴可行吗,会被封吗
|
7
herozzm 2016-04-12 13:54:21 +08:00
会,所以做爬虫最大的问题是控制抓取频率加上较多代理 ip
|
8
dong3580 2016-04-12 14:04:51 +08:00
|
9
pubby 2016-04-12 14:25:19 +08:00
淘宝天猫抓价格都还好,麻烦的是抓淘宝评论数据
|
10
lxjsmdc 2016-04-12 14:38:34 +08:00
|
11
lianyue 2016-04-12 14:49:10 +08:00 via iPhone
@binbinyouliiii 写个 代理脚本就好了呗
|
12
Mysdes 2016-04-12 16:15:05 +08:00
网易的惠惠助手,双十一的时候都官方申明“因为众所周知的原因”关闭了历史价格
|
13
binbinyouliiii OP |
14
Navee 2016-04-12 16:57:35 +08:00
一般爬虫类应用都会有很多代理,请求的时候会使用不同的代理来保证每次都能抓取到数据
|
15
Felldeadbird 2016-04-12 17:05:53 +08:00
找 /买 IP 代理。
|
16
lianyue 2016-04-12 19:28:55 +08:00 via iPhone
@binbinyouliiii 在写个脚本抓互联网上的代理
|