V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Recommended Services
Amazon Web Services
LeanCloud
New Relic
ClearDB
stevele
V2EX  ›  云计算

阿里云升级云盾, 误删用户数据,我也是醉了

  •  9
     
  •   stevele · 2015-09-01 14:11:38 +08:00 · 17751 次点击
    这是一个创建于 3406 天前的主题,其中的信息可能已经有所发展或是发生改变。

    来自微博: http://m.weibo.cn/1747505067/CyvEkrxPS#showPic

    这是啥玩意啊。。。我登上服务器用 vim 修改配置,配着配着我的 vim 进程突然被杀掉了。。。然后我运行 vim 就找不到这个命令了,接着我想用 top 看看是不是有异常进程来着,看着看着老子的 top 进程也被杀掉了,接着 top 命令也没了,我想尼玛命令没了老子重装一下可以吧,结果 apt-get 也这样没了。。。

    109 条回复    2015-09-09 09:54:47 +08:00
    1  2  
    king110
        1
    king110  
       2015-09-01 14:17:05 +08:00
    还是 @左耳朵耗子说得对:还记得前几天我说的那个安全软件成蠕虫病毒的故事么?又来了。呵呵。那些不讲工程科学,坚持用土方法的人还以为自己代表先进的生产力么?

    不黑不吹,静静看撕逼。
    zsmjcnm
        2
    zsmjcnm  
       2015-09-01 14:18:48 +08:00
    mark
    chousb
        3
    chousb  
       2015-09-01 14:20:15 +08:00
    坐等被删
    chousb
        4
    chousb  
       2015-09-01 14:21:53 +08:00
    果断放弃阿里云
    ncwhale
        5
    ncwhale  
       2015-09-01 14:27:57 +08:00
    $rm -rf (某个过期源代码目录)
    $which rm
    /usr/bin/which: no rm in (/usr/local/jdk/bin:.:/usr/local/rvm/gems/ruby-2.0.0-p645/bin:/usr/local/rvm/gems/ruby-2.0.0-p645@global/bin:/usr/local/rvm/rubies/ruby-2.0.0-p645/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/usr/local/rvm/bin:/home/mo/bin )
    ajan
        6
    ajan  
       2015-09-01 14:34:11 +08:00
    看到别人说“我也是醉了”,总忍不住要吐嘈...
    mouseshi
        7
    mouseshi  
       2015-09-01 14:40:52 +08:00
    找那边的人了么?
    kiancyc
        8
    kiancyc  
       2015-09-01 14:45:48 +08:00
    我们的阿里云杭州节点也挂了
    kasp
        9
    kasp  
       2015-09-01 14:47:02 +08:00
    擦。。。我以为服务器被黑了,刚刚把命令恢复好。。。
    SIFT2009
        10
    SIFT2009  
       2015-09-01 14:47:46 +08:00
    这事是有点尴尬,但是个人觉得阿里云在价格上还是比较令人满意的
    janxin
        11
    janxin  
       2015-09-01 15:01:48 +08:00
    还好我的服务器没问题
    yuewolf
        12
    yuewolf  
       2015-09-01 15:07:08 +08:00
    吓死我了,跑去看了下,还好没事。
    青岛 B
    cherrot
        13
    cherrot  
       2015-09-01 15:12:19 +08:00
    北京 B , 上午 11 点出了故障,现在还没恢复……
    assassinpig
        14
    assassinpig  
       2015-09-01 15:23:06 +08:00
    我靠~~~ 果然 被 kill 进程的有一帮人
    jarlyyn
        15
    jarlyyn  
       2015-09-01 15:25:00 +08:00
    是云盾啊?

    我回滚系统盘镜像直接重启了……
    hging
        16
    hging  
       2015-09-01 15:28:39 +08:00
    知足吧......我现在新买的一台服务器 死活上不去. ping 都 ping 不通. 客服一个小时没理我了.
    liyaoxinchifan
        17
    liyaoxinchifan  
       2015-09-01 15:29:23 +08:00
    我的 cut xargs grep 没了。。。
    crll
        18
    crll  
       2015-09-01 15:35:58 +08:00
    @hging 哈哈哈哈
    stevele
        19
    stevele  
    OP
       2015-09-01 15:40:30 +08:00
    @hging 客服,,提工单啊。
    hging
        20
    hging  
       2015-09-01 15:41:57 +08:00
    @stevele =.= 都说工单一小时没人理我了....
    DeweyLiu
        21
    DeweyLiu  
       2015-09-01 15:45:44 +08:00 via Android
    好吧
    evlos
        22
    evlos  
       2015-09-01 15:46:30 +08:00
    青岛 B 区运气好没中枪
    est
        23
    est  
       2015-09-01 15:53:52 +08:00
    Zhongwei
        24
    Zhongwei  
       2015-09-01 15:59:31 +08:00
    来试试 DNSPod 云主机吧 :)
    https://www.dnspod.cn/products/cvm
    zlzhaolei123
        25
    zlzhaolei123  
       2015-09-01 16:02:20 +08:00
    登上服务器发现 java 不见了 重装 jdk java -v 一下就木有了...
    lvfujun
        26
    lvfujun  
       2015-09-01 16:04:20 +08:00
    呵, 之前我的程序代码被删了两次了!
    a84945345
        27
    a84945345  
       2015-09-01 16:07:41 +08:00
    其实我比较关心的是赔偿是什么,已经有人说是 100 倍赔偿了
    aheadlead
        28
    aheadlead  
       2015-09-01 16:23:41 +08:00
    杭州 C 区正常路过
    bigtan
        29
    bigtan  
       2015-09-01 16:24:44 +08:00
    @a84945345 删你的程序只要几分钟,或者几秒钟,赔你你百分钟,你愿意么?
    felixzhu
        30
    felixzhu  
       2015-09-01 16:24:45 +08:00
    工单一天了都没人理我!!有人遇到登录不上去的情况么
    qgy18
        31
    qgy18  
       2015-09-01 16:26:12 +08:00 via iPhone
    PaaS 你干涉用户还说得过去, IaaS 你凭什么进用户的系统去删文件?用户购买了你的 ECS ,只要不跳出你的 Sandbox ,爱怎么折腾是自己的事是吧? 诚然,你的云盾可以解决一部分新手的问题,但是也请至少提供一个完全移除 ECS 云盾的选项,谢谢!
    a84945345
        32
    a84945345  
       2015-09-01 16:26:49 +08:00
    @bigtan 哈哈,这个补偿真的是
    knktc
        33
    knktc  
       2015-09-01 16:29:29 +08:00   ❤️ 3
    @a84945345 嗯, su 丢失了? top 丢失了? yum 没了?我们赔你 100 个 su 命令、 100 个 top 命令、 100 个 yum 命令,分别用数字编号,从 su001 到 su100 ,请依次取用~
    xi_lin
        34
    xi_lin  
       2015-09-01 16:39:44 +08:00
    还好没有上去跑 java ,只跑了个 javac...
    GuangXiN
        35
    GuangXiN  
       2015-09-01 16:42:26 +08:00
    北京 A 现在好像还好,北京 B 系统命令已经被删,青岛 B 我手欠点了一下重启,现在根本启不来了,提了工单就告诉我不要做任何操作,等待工作人员恢复……
    jjx
        37
    jjx  
       2015-09-01 16:48:13 +08:00
    云盾占用内存太大, 足足 700M 以上, 实在无法忍受
    ToysMall
        38
    ToysMall  
       2015-09-01 16:49:14 +08:00
    开了一台服务器,做搜索引擎用的,需要抓取部分数据,被阿里云说对外恶意攻击,然后锁定了我的服务器。
    lwd2136
        39
    lwd2136  
       2015-09-01 16:52:14 +08:00
    @knktc http://www.aliyun.com/support/jpfw/?spm=5176.776688093.1909947.1.TTAg2s#gold-tab-05
    由于阿里云故障
    导致用户云产品无法正常使用
    我们将提供 100 倍的故障时间赔偿!
    让您使用舒心
    故障 1 小时赔 100 小时?业务损失嘛自己兜着
    关键还敢用么 赔你你不用 那我们也仁至义尽了
    assassinpig
        40
    assassinpig  
       2015-09-01 17:05:40 +08:00
    @jjx 如果低配 512 的机器 出现类似 700M 的情况,结果是???
    xuhaoyangx
        41
    xuhaoyangx  
       2015-09-01 17:08:48 +08:00
    @ToysMall 结果呢
    ToysMall
        42
    ToysMall  
       2015-09-01 17:09:56 +08:00
    @xuhaoyangx 手动解锁了一次,然后第 3 天又被锁定了,刚又解锁了。
    webflier
        43
    webflier  
       2015-09-01 17:27:02 +08:00 via Android
    @ToysMall 哈哈,我做 ip forward 也被云盾锁了。经过跟客服撕逼,把我加入云盾白名单 90 天,后来想想 90 天后还要撕逼,直接放弃阿里云了,就当花钱喂狗了
    ToysMall
        44
    ToysMall  
       2015-09-01 17:35:23 +08:00
    @webflier 给阿里云跪了
    duangaduang
        45
    duangaduang  
       2015-09-01 17:41:46 +08:00
    吓得我赶紧去看看,还好我是北京 A
    GuangXiN
        46
    GuangXiN  
       2015-09-01 17:42:28 +08:00
    目前我还没有看到谁的用户数据被删除,只看到有人说系统命令被删了,不过依然可以算大事故了。
    ixiaohei
        47
    ixiaohei  
       2015-09-01 17:44:30 +08:00
    你们这么说的,我都不敢买阿里云
    GuangXiN
        48
    GuangXiN  
       2015-09-01 17:44:38 +08:00
    @qgy18 按理说是不应该动用户的系统的,不过阿里要把反病毒和监控当卖点,自然有可能卖点变槽点。
    soundbbg
        49
    soundbbg  
       2015-09-01 17:44:58 +08:00
    我去,我们的 sudo 命令都没了,崩溃。
    lvfujun
        50
    lvfujun  
       2015-09-01 17:46:44 +08:00
    @GuangXiN 我的被删了,/
    yangdaojun
        51
    yangdaojun  
       2015-09-01 17:51:37 +08:00
    都遭了,不管执行什么命令都提示被 killed ,然并卵!
    退出了 ssh 远程,现在远程都连不上了。
    中午发现到现在整个下午了都还没有反应!
    predator
        52
    predator  
       2015-09-01 17:56:00 +08:00
    带新人摸服务器第一课就是强调不管啥不顺眼的老掉牙的,你没把握就找个临时目录把它 mv 进去,或者改个文件名

    居然有人牛逼到写个所谓的安全软件放手去删除客户虚机里面的执行文件……完全不理解这些人的底气从哪里来的
    lxx1
        53
    lxx1  
       2015-09-01 18:08:59 +08:00
    lxx1
        54
    lxx1  
       2015-09-01 18:12:56 +08:00   ❤️ 1
    赔偿范围:
    因阿里云故障导致 ECS/SLB/RDS/OSS 无法正常使用,以及阿里云故障引起的网站无法正常访问,阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:
    1 、阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;
    2 、由于运营商故障导致的丢包和延时等不可用情况;
    3 、用户的应用程序或数据信息受到黑客攻击而引起的;
    4 、用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;
    5 、用户自行升级操作系统所引起的;
    6 、用户的应用程序或安装活动所引起的;
    7 、用户的疏忽或由用户授权的操作所引起的;
    8 、不可抗力以及意外事件引起的;
    9 、其他非阿里云原因所造成的不可用。


    第 8 条也是醉了
    xshell
        55
    xshell  
       2015-09-01 18:25:36 +08:00
    误删的都在全部回滚·~~
    Lucups
        56
    Lucups  
       2015-09-01 18:35:12 +08:00
    我擦!难道今天我们服务器不是被攻击的?

    上午发现 git/svn 等一系列的命令突然都不能用了,一台 dev 一台 prod 都出现了,以为被黑, last 一看也没发现异常登录信息,于是速度 passwd ,确认输入的时候突然被中止了。。。

    坐等真相。
    orvice
        57
    orvice  
       2015-09-01 18:36:34 +08:00
    @lxx1 这个属于意外事件吗....
    jiongxiaobu
        58
    jiongxiaobu  
       2015-09-01 18:38:16 +08:00 via Android
    要阅兵啦
    lxx1
        59
    lxx1  
       2015-09-01 18:41:35 +08:00
    @orvice 这个就要问阿里云的客服了,是不是意外事件他们说了算。。
    xshell
        60
    xshell  
       2015-09-01 18:50:01 +08:00
    赔偿范围···呃,后面就成撕逼了
    tianrunlin
        61
    tianrunlin  
       2015-09-01 18:55:34 +08:00
    难怪今天中午远程老是断掉,我还以为自己网络有问题
    leebo
        62
    leebo  
       2015-09-01 19:00:13 +08:00
    郁闷 现在恢复了吗 我今天要上线新功能呢
    lxx1
        63
    lxx1  
       2015-09-01 19:25:28 +08:00
    @xshell “但不包括以下原因所导致的服务不可用时间”,,然后就罗列了 9 条,基本包括了所有的故障情况,, 2333 ,想的真周到啊
    nlzy
        64
    nlzy  
       2015-09-01 19:54:20 +08:00 via iPhone
    不知道深圳 A 区有没有被影响到
    baiyemao
        65
    baiyemao  
       2015-09-01 20:02:49 +08:00
    9.3 印象,哈哈,你要理解,我的 ss 老是挂掉不稳定。
    1ychee
        66
    1ychee  
       2015-09-01 20:08:22 +08:00
    @lxx1 所以。。不知道还有什么情况是可以得到赔偿的?第八条等于是万能耍赖利器啊!
    LioMore
        67
    LioMore  
       2015-09-01 20:11:25 +08:00
    赶紧换用美团云,以绝后患
    lxx1
        68
    lxx1  
       2015-09-01 20:59:40 +08:00
    @1ychee 能得到赔偿的,一般都是事情比较严重,影响范围比较大的,其他的情况估计要得到赔偿是不可能的
    realpg
        69
    realpg  
       2015-09-01 21:00:59 +08:00
    看来以后选择要向鹅厂云服务倾斜了……
    jjx
        70
    jjx  
       2015-09-01 21:10:33 +08:00
    要吐槽的还有聚石塔 , 阿里云好歹有 ssd, pgsql 了, 它什么都没有, 还非得逼人家改造

    像咱用 pgsql 好好的, 为了入塔, 非得逼我们用 mysql rds, 我是打算放弃了
    kalintw
        71
    kalintw  
       2015-09-01 21:16:07 +08:00
    审查,审查,审查。
    哈哈哈!
    ianisme
        72
    ianisme  
       2015-09-01 21:21:55 +08:00
    又招实习生了吗?
    GuangXiN
        73
    GuangXiN  
       2015-09-01 21:41:49 +08:00
    @lvfujun 恭喜你,有备份吧?
    y1993bbz
        74
    y1993bbz  
       2015-09-01 21:46:33 +08:00
    貌似恢复了?
    qgy18
        75
    qgy18  
       2015-09-01 21:53:37 +08:00
    @GuangXiN 阿里那些小心思大家都明白,所以我拿到 ECS 之后第一时间把那个安骑士给卸载了。
    这一点 linode 很好, linode 也有需要装客户端的监控,但是默认不会给你装上。
    dahvlh
        76
    dahvlh  
       2015-09-01 22:07:25 +08:00 via iPad
    @yuewolf 话说你这个头像是什么出处呀
    churchmice
        77
    churchmice  
       2015-09-01 22:12:37 +08:00
    说好的牛逼哄哄的技术呢
    给我继续吹大数据,高并发
    msg7086
        78
    msg7086  
       2015-09-01 22:20:23 +08:00
    @qgy18 linode 监控是独立的服务,和 linode 服务器没关系,而且这监控是监控的服务器状态,不是监控用户文件数据。
    mechgouki
        79
    mechgouki  
       2015-09-01 22:43:17 +08:00
    科学规律是必须遵守的 没有办法跳跃发展
    GuangXiN
        80
    GuangXiN  
       2015-09-01 23:25:24 +08:00
    @qgy18 Linode 的监控是非侵入式的,我读过他们 longview 在我主机上运行的程序代码,就是一个定时上报程序,不像阿里云的云盾那样还管病毒杀毒和用户进程分析。
    rrfeng
        81
    rrfeng  
       2015-09-01 23:34:15 +08:00
    差点吓死我还好没出问题……
    qgy18
        82
    qgy18  
       2015-09-01 23:43:49 +08:00
    @GuangXiN 之前的杀毒软件 windows 服务器版,比如说诺顿,发现病毒也只会隔离,毕竟对于服务器来说,保全资料是第一位的。阿里这个云盾太虎了,权限太高,能力不够。
    karloku
        83
    karloku  
       2015-09-01 23:53:14 +08:00
    云顿就是个最大的病毒.. 以前云盾的升级进程把我云主机的磁盘 io 给卡爆过..
    fange01
        84
    fange01  
       2015-09-01 23:55:42 +08:00
    @Zhongwei 哎呀我操, dnspod 上主机了。。。不是直接搞的腾讯云吧?
    arronliu
        85
    arronliu  
       2015-09-02 00:10:19 +08:00 via iPhone
    病毒查杀病毒结果把用户数据删除了,真是搞笑
    kfll
        86
    kfll  
       2015-09-02 00:29:16 +08:00 via iPhone
    我猜是这样的,被删掉的二进制文件里面大概有十六位是 00110110 00110100
    mathgl
        87
    mathgl  
       2015-09-02 00:40:30 +08:00 via Android
    @lwd2136 居然敢用阿里云做企业用户?
    hactrox
        88
    hactrox  
       2015-09-02 00:55:48 +08:00
    青岛可用区 B 已跪。
    dreamtrail
        89
    dreamtrail  
       2015-09-02 01:03:25 +08:00
    配置 vps 的时候,第一时间就删除了云盾服务看来是正确了
    GuangXiN
        90
    GuangXiN  
       2015-09-02 01:16:06 +08:00
    @qgy18 没用过诺顿,以前用 Windows 2000 的时候装了江民 KV3000 ,它也不删除,而是隔离病毒文件,但是病毒库发生错误的时候也把 Windows 内核的一个关键 DLL 给隔离了,然后开机不能,只好用软盘启动手工修复。这次阿里对外公布的理由也是云盾升级误把系统程序隔离。
    GuangXiN
        91
    GuangXiN  
       2015-09-02 01:35:36 +08:00
    @mathgl 对于许多没有运维的小企业来说,用阿里云已经比自己运维安全太多。

    其实这次事故影响并没有大家吐槽的那么大,我们公司租用的 4 台 ESC 只有两台被波及,而且只要不重启系统,应用服务仍然可以继续正常运行。

    我们也就手欠重启了那台开发测试用的云服务器,结果一直搞到深夜才恢复。

    按一年一次这种大事故,一次 10 小时计算,阿里云还是有 99.88%稳定运行时间,虽然没有官网的广告说的那么好,但是比自己运维还是好得多。以前网站迁移到阿里云之前,平均每两个月出一次大的运维事故,从物理磁盘损坏到网卡故障到机房断电到手欠误删数据却无快照可回滚,最奇葩的一次是突然网络终断,要求机房值班人员处理,他们居然排查了快五个小时才发现不知道谁把我们服务器的网线扯下来了,囧……

    故障多都不说了,最恶心的是我们支付着比阿里云更高的网络托管费用,却用着 BGP 机房的联通快、电信慢、移动根本打不开的网络,致电机房要求检查问题的原因,他们就各种推说是我们应用程序的问题,把 traceroute 结果和下载速度测试截图给他们看他们才说帮看看,最后看了五天都没有结果,天天电话催都答复正在排查和协调。

    当然阿里云也不是没有需要改进的地方,比如他们设计修复方案的时候就应该知道无法启动的实例根本不可能远程统一修复,需要回滚数据,再手动恢复,可是偏偏让我们不要进行任何操作,拖了八个小时才给出回滚的解决方案。所谓的 100 倍赔付赔的也不是你的实际损失,而是服务器故障时间的 100 倍,宕机 1 分钟让你免费多用 100 分钟。如果关键业务停了损失巨大的话,还是赶快另启一个实例把业务迁过去来得靠谱。
    msg7086
        92
    msg7086  
       2015-09-02 02:54:54 +08:00
    @GuangXiN 阿里云是云 /VPS 服务。
    运维?没见过 VPS 自己磁盘损坏的(都是母机损坏),没见过自己网卡故障的(母机网卡挂了倒是正常),没见过 VPS 可以把网线扯下来的。手欠删数据这个没办法,除了用 VPS 的自动备份外解决不了。

    拿 VPS 去和独服比有意思么。

    而且这和阿里云完全没啥关系。
    chuangbo
        93
    chuangbo  
       2015-09-02 03:52:55 +08:00 via iPhone
    @GuangXiN 中肯。阿里云再差,也比自己租用服务器问题少。
    可是如果在几个云服务横向选择呢?
    zent00
        94
    zent00  
       2015-09-02 07:08:45 +08:00 via iPhone
    @GuangXiN 你说的这些优势,很多服务商都可以满足,不一定非得阿里云。
    x615
        95
    x615  
       2015-09-02 08:45:41 +08:00
    使用阿里云,第一件事难道不是卸载云盾么?
    lliioogg
        96
    lliioogg  
       2015-09-02 09:02:02 +08:00
    居然真有人用阿里云。。知道的不都知道怎么回事么
    xshell
        97
    xshell  
       2015-09-02 09:31:13 +08:00
    重大事故
    stevele
        98
    stevele  
    OP
       2015-09-02 10:36:54 +08:00
    我的帖子已经不在首页显示了,不知道什么情况。呵呵嗒
    vzch
        99
    vzch  
       2015-09-02 10:48:02 +08:00
    刚在微博搜索,除了陈皓的微博和几条广告,其他都搜不到阿里云相关的信息......
    49
        100
    49  
       2015-09-02 11:34:58 +08:00 via Android
    因为要 93 了啊,怕你们这些家伙乱说话,所以就让阿里云把你们的 vps 给弄坏。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2789 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 138ms · UTC 14:02 · PVG 22:02 · LAX 06:02 · JFK 09:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.