V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zsyld
V2EX  ›  问与答

针对爬虫 返回污染数据 导致爬取者损失的 是否要负法律责任?

  •  
  •   zsyld · 2021-03-05 10:18:53 +08:00 · 4113 次点击
    这是一个创建于 1120 天前的主题,其中的信息可能已经有所发展或是发生改变。

    举个例子,

    网易的藏宝阁,很多脚本捡漏的,秒级下单付款完成

    网易在知道某个请求是脚本的情况下,返回污染数据,比如某个实际价值只有几元 /几十元的虚拟商品,标价数十万,爬虫者给付款了,网易有责任吗?

    第 1 条附言  ·  2021-03-05 11:07:02 +08:00
    这个捡漏是这样的,就是一堆筛选条件,这些筛选条件应该很多很严格,网易返回符合条件的虚拟商品,然后捡漏者设定一个价格值(大多数是直接少 0 ),低于这个价格的直接脚本付款,因为这个可以多人同时下单,谁先付款就是谁的,所以很少有脚本在付款的时候是人工审核的

    那么网易在返回数据中插入一个不符合筛选条件的商品,价格很贵....如何?

    这个不符合筛选条件的商品数据网易不会去伪造的,就是正常玩家卖的东西,只不过标了个很高的价格....
    46 条回复    2021-03-06 01:13:37 +08:00
    czfy
        1
    czfy  
       2021-03-05 10:20:31 +08:00
    爬虫本来就在灰色地带
    还有反过来告状的吗?
    chinvo
        2
    chinvo  
       2021-03-05 10:25:15 +08:00 via iPhone
    建议去问专业的律师
    wjup
        3
    wjup  
       2021-03-05 10:25:59 +08:00
    这和碰瓷的老人有啥区别😂
    wzzzx
        4
    wzzzx  
       2021-03-05 10:27:52 +08:00
    网易:我鬼知道你是爬虫啊,我这东西就明码标记,不退不换怎么了
    ilaipi
        5
    ilaipi  
       2021-03-05 10:28:18 +08:00
    捡漏都挑这么贵的捡嘛
    zsyld
        6
    zsyld  
    OP
       2021-03-05 10:37:01 +08:00
    @czfy
    @wjup
    @wzzzx 如果没风险的话,网易为什么不这么搞?因为我好几次 app 刷出来的想买的,都被脚本抢了...苦呀


    @ilaipi 有的,数十万的应该比较少,几千,数万的很多的,也有过买脚本想捡漏的人被卖脚本的这样坑杀过的....
    yunying
        7
    yunying  
       2021-03-05 10:38:14 +08:00
    账户里真多钱。。。
    zictos
        8
    zictos  
       2021-03-05 10:41:34 +08:00   ❤️ 1
    怎么证明是爬虫?服务器那边的数据网易想怎么伪造都可以。既然针对爬虫用户可以这样,那针对正常用户是不是也可以返回污染数据?反正事后用户没办法证明自己看到的是污染数据。

    另外几十元的东西卖家本身也是标价几十元,但网易故意给出十万的价格,爬虫者付款到网易平台,最后多出的钱由网易私吞吗?怎么着也是不当得利了吧!
    rootmaster
        9
    rootmaster  
       2021-03-05 10:43:38 +08:00
    我觉得网易无责
    also24
        10
    also24  
       2021-03-05 10:45:18 +08:00
    @zictos #8
    网易有再大的本事,也修改不了支付通道那边的数据。
    不论网易怎么改,支付通道那里显示的一定是真实的支付数额。

    那么,当一个正常用户看到支付宝提示本单需要支付十万元的时候,应该继续支付么?


    另附:《中华人民共和国合同法》
    http://www.gov.cn/banshi/2005-07/11/content_13695.htm

    第五十四条 下列合同,当事人一方有权请求人民法院或者仲裁机构变更或者撤销:
      (一)因重大误解订立的;
      (二)在订立合同时显失公平的。
      一方以欺诈、胁迫的手段或者乘人之危,使对方在违背真实意思的情况下订立的合同,受损害方有权请求人民法院或者仲裁机构变更或者撤销。
      当事人请求变更的,人民法院或者仲裁机构不得撤销。
    mhycy
        11
    mhycy  
       2021-03-05 10:53:31 +08:00
    预设前提做不到网易无责,但修改前提可以

    1 、返回污染数据实际为跳转页面,最终跳转到虚拟商品页面按原价收款
    2 、虚拟商品价格*最低购买量为原始页面的最终售价

    满足以上两点能规避不当得利与诱导消费
    因为跳转本身人类用户肯定能判断东西不对(虽说爬虫可以适配)
    zictos
        12
    zictos  
       2021-03-05 10:58:25 +08:00
    @also24 #10
    我的意思是正常用户看到的价格就是十万,并且他愿意支付十万。因为正常用户看到的商品的确是价值十万的商品,网易故意把价值几十元的商品的图片换成了价值十万的商品的图片。

    虚拟物品显失公平或重大误解不太好判断。像梦幻西游的一些宝石、兽决之类的比较好判断,但装备和角色比较难,不过价格差距太大应该还是可以的。

    搞不好算欺诈或诈骗也是有可能的,爬虫者照样受消费者权益保护法保护。
    再说爬虫一般也是模拟人工而已,同样都是网络请求( get 或 post 请求),你返回错误的数据就是你的问题了。就好比某人用了一个自己开发的从来没有人听过的浏览器访问藏宝阁,难道你就要返回错误的数据吗?并没规定一定要用某个知名浏览器,并没规定自己开发的浏览器就不能用。
    最后,现在并没有任何法律明确规定爬虫是违法的,很多大公司照样在用爬虫。另外还有一些股票交易软件之类的也可能用到。只是法律自由裁量权挺大的,有时候说犯罪就是犯罪了,说不是就不是。
    nutting
        13
    nutting  
       2021-03-05 10:59:38 +08:00
    网易不敢这么做的
    sagaxu
        14
    sagaxu  
       2021-03-05 11:00:14 +08:00 via Android   ❤️ 1
    @zsyld 被你买去和被脚本买去,网易的收益有差别吗?
    zictos
        15
    zictos  
       2021-03-05 11:00:18 +08:00
    像携程的买火车票应该也是爬虫吧
    also24
        16
    also24  
       2021-03-05 11:03:28 +08:00
    @zictos #12
    『网易故意把价值几十元的商品的图片换成了价值十万的商品的图片』

    几十元和十万,差距还是太大了,总有办法找到市场价来区分的。


    那么我们可以试试把价格差距改小一点看看,比如说:
    几十元的商品标成几百元,然后再打个名牌 logo 吧。
    诶?这怎么好像似曾相识呢?

    拼夕夕:勿 cue
    zsyld
        17
    zsyld  
    OP
       2021-03-05 11:09:44 +08:00
    @sagaxu 这不是重点,我想知道有没有责任,哪天我的库被别人爬了,我这样搞会不会出事...
    zictos
        18
    zictos  
       2021-03-05 11:11:42 +08:00
    @also24 #16 比如装备,一个几十元的垃圾装备和十万的装备,肯定属性不同。用户可以根据属性了解到这个装备值十万,程序也可以通过预先设定的数据判断这个装备值十万。所以真人与程序并不会有什么差别。所以完全用不着举几百元的例子,有些装备的价格差距就是很大的。
    kop1989
        19
    kop1989  
       2021-03-05 11:15:48 +08:00
    如果能够判断出是爬虫,那么直接拒绝访问不就可以了。
    能否分享返回干扰数据和拒绝访问相比,有什么优势么?

    在我个人看来,返回干扰数据完全是损人不利己的赔本买卖。费流量、费算力,最终也只是隐晦的暗示对方“抓到你了”,对方要是愚钝没准都不会发现、停止。依然会浪费你的算力和带宽。

    还不如直接拒绝访问,给对方一个“明示”。
    xingshu1990
        20
    xingshu1990  
       2021-03-05 11:17:42 +08:00
    用非法的事情,本来的目的是想获利。
    这个需求从开始到结果发生前一刻,使用脚本的人的目标就没有发生改变。要说法律责任的话,首先制作脚本或者使用爬虫的人,首先违法。

    给爬虫脏数据,以前有一个大公司的程序员,开过一次公开课,讲过反反爬虫策略。我也不懂这个反反爬虫策略,不过脚本单单只用以图搜图做下单,这个不严谨。
    also24
        21
    also24  
       2021-03-05 11:19:24 +08:00
    @zictos #18
    你没理解到我为什么举几百块的例子…… 因为这就是典型的『假冒伪劣』商品啊。

    一个交易平台,如果不积极参与处置假冒伪劣商品,口碑都会一落千丈。
    那么一个成熟的平台,如果选择自己官方纵容、甚至参与售假,后果是什么呢?

    为了 10 万块钱,赌上整个平台的商誉?
    also24
        22
    also24  
       2021-03-05 11:24:18 +08:00
    @kop1989 #19
    暂且不说楼主说的这种比较极端的直接造成经济损失的干扰数据。

    就说日常的反爬虫吧,不拒绝访问,而是返回一些看起来不好判断真假的数据。
    那么爬虫方就很难确定自己当前的程序是否被抓到了,自然也就不能及时做出修改。
    爬虫方无法及时做出反反爬虫措施,那反爬方也就不必着急更新更严格的反反反爬虫措施,给自己省心啊。
    xingshu1990
        23
    xingshu1990  
       2021-03-05 11:24:38 +08:00
    @xingshu1990 #20 也不能说违法,只能说是:作弊。
    参考阿里员工用脚本抢月饼。

    不管他抢月饼是用来卖的,还是他自己吃,他用脚本这个方式,就是通过作弊手段获利了。这个观点不能模糊掉。
    woshipanghu
        24
    woshipanghu  
       2021-03-05 11:27:54 +08:00
    返回假数据应该是常规操作
    zictos
        25
    zictos  
       2021-03-05 11:28:12 +08:00
    @also24 #21 也可能误伤正常用户,一旦被曝光,后果很严重。 如果反爬真那么厉害,能 100%不会误伤,那为什么现在很多网站还在正常用户访问网站的时候动不动弹验证码。
    also24
        26
    also24  
       2021-03-05 11:33:08 +08:00
    @zictos #25
    因为对于正常用户的话,在支付 10 万元的时候就停止操作了啊。
    即使真的手快支付成功了,网易会拒绝退还这 10 万元么?
    ditel
        27
    ditel  
       2021-03-05 11:41:01 +08:00 via Android
    这样看起来商品好像有些问题
    zictos
        28
    zictos  
       2021-03-05 11:41:17 +08:00
    @also24 #26 涉及到金钱支付的流程的时候爬虫也不傻,肯定会多次判断。确保页面的东西跟价格匹配才支付的。爬虫是去捡漏的,自然会有大量预先设好的数据,知道自己需要什么物品,知道什么物品值多少钱。只有当物品确实很便宜的时候才会购买。

    我前面说了是返回污染的数据,但这个污染的数据是改了图片。所有不管是爬虫还是正常用户都知道这个物品的确是值 10 万的。所以如果误伤了正常用户,那正常用户也会认为这个东西值 10 万,也可能买。

    这不是退不退还的问题。如果说自己买前看到的东西与最终付款后订单中显示的东西不一样,那说明这个网站有漏洞或者完全没有信誉可言,用户也可能去网上曝光。况且虽然是误伤,但网易可能依然会认为用户是爬虫,并且坚持价格没问题。
    rogi
        29
    rogi  
       2021-03-05 11:41:41 +08:00
    @also24 老哥真的猛,25 小时高强度冲浪
    also24
        30
    also24  
       2021-03-05 11:44:58 +08:00 via Android
    @zictos
    一个会多次判断商品和价格匹配的爬虫… 却连支付限额都没写的意思?
    ward56
        31
    ward56  
       2021-03-05 11:48:10 +08:00
    楼主脑洞非常强,请收下在下的膝盖。
    zictos
        32
    zictos  
       2021-03-05 11:48:49 +08:00
    @also24 #30 10 万只是举例,也许他愿意买 10 万的东西,只有买贵的东西才赚得越多,他觉得 10 万不算什么,但他设了 20 万的限额
    keepeye
        33
    keepeye  
       2021-03-05 11:48:49 +08:00
    非法途径被坑了只能自己打碎牙齿往肚里咽吧 用户协议里面应该有这方面的条款
    zictos
        34
    zictos  
       2021-03-05 11:55:50 +08:00
    @also24 #30 说实话,我以前玩梦幻西游,还用 python 写过收货脚本。
    就是识别物品的图片,比如收购宝石就识别宝石的种类以及等级,是需要多次判断的。包括图片识别、文字识别以及判断价格的位数与物品是否匹配。不然一个 1 级宝石和 10 级宝石差别大了去了,比如 1 级宝石 6 毛钱,10 级宝石将近 300 元。一旦出错就是几百元损失。
    also24
        35
    also24  
       2021-03-05 11:57:03 +08:00
    @zictos #32
    算了,我直接列单子吧:

    假设 A 物品,价值 10 元;
    B 、C 物品,价值 10 万元
    D 物品,与 B 物品长得非常像,但实际价值 5 万元。


    情况 1:
    用户期望购买 A 物品,查看 A 物品详情,下单支付时变为 B 物品,订单记录为 B 物品,实际发货为 B 物品:
    正常用户在支付时就应当停止操作,即使真的昏了头,大概率可以通过合理途径找回。

    情况 2:
    用户期望购买 A 物品,查看 A 物品详情,下单支付时为 A 物品,但价格为 B 物品的 10 万元,订单记录为 B 物品,实际发货为 B 物品:
    正常用户在支付时就应当停止操作,即使真的混了头,大概率可以通过合理途径找回。

    情况 3:
    用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 A 物品,实际发货为 A 物品:
    正常用户在查看订单记录或收货时会发现问题,这属于显失公平的情况,大概率可以通过合理途径找回。

    情况 4:
    用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,订单记录为 C 物品,实际发货为 C 物品:
    平台这么干的意义是什么?

    情况 5:
    用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 B 物品,实际发货为 D 物品:
    这就是典型的假冒伪劣情况,在各类电商平台上都能看到,由于订单记录为 B 物品,一般维权难度不大。

    情况 6:
    用户期望购买 B 物品,查看 B 物品详情,下单支付时为 B 物品,且价格为 B 物品的 10 万元,订单记录为 D 物品,实际发货为 D 物品:
    这就是典型的假冒伪劣情况,同时平台深度参与售假,问题是,平台这样做的获利,是否能填补自身的商誉损失呢?
    imn1
        36
    imn1  
       2021-03-05 12:13:51 +08:00
    想到两个词:大数据杀熟、市场供需定价

    然后扩展一下思维,“自动下单”、“捡漏”算不算“杀熟”?只不过逆转了立场,买方“杀”卖方而已
    又扩展一下,自动下单有法律责任么?去 12306 抢票呢?
    漂移一下,股票交易不少机构是脚本交易,就是根据股价由电脑完成交易,非人工操作

    其实我也不知道哪个对哪个错,似乎定价是关键点,但价格法也没去研究
    遇上大数据杀熟的话(换个词就是从“定价商品”变为“议价商品”),我也很气愤,但又说不出错在哪个点

    但有一点是肯定的,无论哪方才用了超出正常交易的方式,都会影响自身信誉,买卖双方都是
    zictos
        37
    zictos  
       2021-03-05 12:15:04 +08:00
    @also24 #35 你举的例子正好就证明了正常用户也可能下单并出现跟自己买前看到的物品不一致的情况。
    即便是爬虫程序,在最终支付的时候肯定也会再次判断当前页面的内容的,一个页面一个页面来的,跟正常用户差不多。

    你说的情况 6,这个一般没平台会这么做,但倘若消费者真遇到了,那可能要自认倒霉了。虽说不太可能出现这种情况,但不知道程序会不会有类似意外(或不能复现的 bug )或者内部人员进行非法操作但查不到之类的。

    举个例子,你用网银转账 1 万,你转账前看得清清楚楚就是 1 万元,但转完后查看交易记录发现转了 10 万元。银行坚称是你自己转了 10 万元,你根本就没法证明你只转了 1 万元,因为你不可能全程录视频。就算曝光后大部分人也会相信银行,他们会坚信银行的系统不会出错,没几个人会相信你。
    also24
        38
    also24  
       2021-03-05 12:22:25 +08:00
    @zictos #37

    『虽说不太可能出现这种情况,但不知道程序会不会有类似意外(或不能复现的 bug )』


    这段话对所有电商、支付系统都适用。
    zictos
        39
    zictos  
       2021-03-05 12:24:19 +08:00
    @also24 #35 我有一次在饿了么出现一份普通盖码饭花了 30 多元的情况。那个店平时都有满减,盖码饭原价 30 多,满减后就是 13 元的样子,实际就算实体店也是只要 13 的样子,故意提高价格再满减的,就是一份很普通的盖码饭。

    然后我点完后过了一个月才发现扣了 30 多元。但是我平时下单一般在订单页面以及支付宝付款页面都会看的,我不敢相信我会这么大意。但支付宝里面也显示是 30 多元,所以饿了么不太可能联合支付宝这样,所以应该是我真的大意了。

    不过倘若平台真的有这种买前及买后显示的价格不一样的情况,事后你真的没法证明,因为不可能下单时录视频。饿了么好歹有支付宝,美团就是自带的支付,他完全可以改任何数据。
    Maboroshii
        40
    Maboroshii  
       2021-03-05 13:07:07 +08:00
    "怎么是污染呢,就是开发不小心写了一个 bug 而已"
    persistz
        41
    persistz  
       2021-03-05 13:32:57 +08:00
    “在返回数据中插入一个不符合筛选条件的商品”,这一点要做到并不容易。
    hafuhafu
        42
    hafuhafu  
       2021-03-05 14:03:14 +08:00
    这不就类似蜜罐嘛。
    就算不犯法也不会这么干,没啥意义,除非写爬虫 /脚本的人傻,不然不会成功的。
    捡漏的目的不就是为了扫少零,你标一个很贵的价格,直接就过滤掉了,不会去发起支付的。
    假设如果标的垃圾物品的价格是少零的价格,还会再用物品 ID 、名称之类的东西再去判断的,大额的还会再去判断很多,做这种脚本的人都是宁愿少抢也不会乱抢的,和抢茅台、抢票根本不是一个概念,后者一个是成功也只是进入待支付状态,而且基本上没有变化。
    以前玩游戏也有弄过少零 qq 群机器人通知,人家能抓的数据比玩家在客户端直接看到的多的多,比如玩家能看到某项数值小数点后 2 位,实际上有 4 位...
    hahiru
        43
    hahiru  
       2021-03-05 15:50:20 +08:00
    意思理解。估计是两个案子。一个是你用不正当手段获取数据。另一个是交易纠纷。纠纷可以起诉调解。
    phony2r
        44
    phony2r  
       2021-03-05 20:21:35 +08:00
    ???
    jones2000
        45
    jones2000  
       2021-03-06 00:33:37 +08:00
    人家都有法务部门的, 这个功能上线肯定事先都咨询过法务部门的。估计没戏。
    z761031
        46
    z761031  
       2021-03-06 01:13:37 +08:00 via iPhone
    法律不保护违法所得,比如小姐收的嫖资

    爬虫某种意义上也是违法的,所以你的收益不受法律保护
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2411 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 15:59 · PVG 23:59 · LAX 08:59 · JFK 11:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.