V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
8e47e42
V2EX  ›  问与答

所以, Onedrive 居然也扫描用户上传的文件?

  •  
  •   8e47e42 · 2021-07-02 19:10:43 +08:00 · 5031 次点击
    这是一个创建于 1274 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://v2ex.com/t/786746

    后续:备份了大概 20G 文件,直接收到微软邮件:

    Microsoft 365 has industry-leading data protection technology which looks out for cyber attacks on your files. Your OneDrive account recently started showing signs of suspicious activity. We found 2157 files that appear to be compromised by a ransomware attack. 
    Ransomware is a type of malicious software designed to block access to your files until you pay money. 
    Visit OneDrive.com within 30 days of the attack to: 
    •	Review suspicious files and confirm they have been compromised
    •	Remove ransomware from your devices
    •	Restore your files on OneDrive
    You can restore your files on OneDrive for only 30 days after they were compromised. If you don't restore the compromised files within 30 days from the ransomware attack, the files won't be recoverable. 
    
    

    我 review 了一次,又备份了大概 100 个小文件,又收到了一样的邮件。

    所以至少说明 OneDrive 其实隐私也不行,也一样会扫描你上传的文件,而且没办法关闭。

    第 1 条附言  ·  2021-07-02 20:47:48 +08:00
    问题比较大的是 OneDrive 的这个操作要么 ML 了行为特征(如 @mschultz 所说匹配了后缀+文件数量),但是 ML 调参吗?调参会看到数据吗?是谁看到呢?这里想象空间有点大。当他说“industry-leading data protection technology”的时候我第一反应是至少我的文件名肯定是被 ML 了,他们 ML 的数据怎么来的?如果我的数据被作为了样本他们怎么判断这个数据是否来自勒索软件?

    我并没有希望它做这个 ML 更不要它这个保护——这个功能居然无法关闭,就像越来越难关闭的自带反病毒一样让人讨厌

    服务商能看到这个没问题,问题是应该要符合一般的流程并且需要审计(我是付费用户,这里根据 MS 的逻辑我应该是数据的拥有者),像 Google 我也知道你能看到,但是他的客户数据访问都是遵循一定的流程进行的,虽然产品稀碎,程序正义这点上还是做到的,例如: https://workspace.google.com/learn-more/security/security-whitepaper/page-6.html#:~:text=Google%20Workspace%20customers%20own%20their,commitment%20to%20protecting%20customer%20data.
    22 条回复    2021-07-04 01:00:09 +08:00
    mschultz
        1
    mschultz  
       2021-07-02 19:28:56 +08:00   ❤️ 2
    是这样的。使用 Cryptomator (从前情提要看不出你到底用了没有,但假定你用了,或者用了类似的加密软件,因为我上次也是用 Cryptomator 的时候遇到了这个提示)会产生大量的 *.c9r 后缀的加密文件,OneDrive 会识别到,以为你的文件被勒索软件加密了,然后给你发提醒。

    但是我个人认为这种行为,不足以认为 OneDrive 「作了一个网盘提供商不该作的恶」,也不能证明它会人工地审核你的文件。

    它还有相册功能,展示你所有文件中的图片,说明它肯定也扫描了各个文件夹中的图片后缀啊。

    而且你的文件加密了,密文被 OneDrive 扫描了你没有什么损失,你只是通过这个通知知道了一个早就是公开的事实:上传到网盘上的文件,网盘服务商是能看到的。
    emberzhang
        2
    emberzhang  
       2021-07-02 19:32:50 +08:00 via iPhone
    只有 iCloud 相册的分类算法是是本地人工智障吧,所以那么垃圾真的可以理解(推荐照片动不动鬼影重重),one drive 应该跟 Google 一样都是云端大数据吧,微软有说过是本地 AI 吗?
    JQSM
        3
    JQSM  
       2021-07-02 19:34:01 +08:00 via Android
    正规网盘都会扫,而且你如果存了不该存的东西,会被 FBI 查水表。
    wunonglin
        4
    wunonglin  
       2021-07-02 19:39:28 +08:00
    所有厂商都会扫。

    为什么你会觉得别人不会扫描你的东西呢?
    dingwen07
        5
    dingwen07  
       2021-07-02 19:42:40 +08:00 via Android   ❤️ 1
    @emberzhang OneDrive 不分析你的相册,Google 是分析的

    @JQSM 国外网盘一般只处理分享出去的文件
    JQSM
        6
    JQSM  
       2021-07-02 19:57:36 +08:00 via Android
    @dingwen07 某些东西只要你持有就是犯罪,即便你存在自己硬盘里,例如和儿童相关的。如果传到网盘里相当于自首。
    lihua
        7
    lihua  
       2021-07-02 20:20:53 +08:00 via iPhone
    考虑下 mega,端对端加密
    sky96111
        8
    sky96111  
       2021-07-02 20:29:32 +08:00 via Android
    只需要检查文件后缀,其实不能完全证明扫描了文件内容
    8e47e42
        9
    8e47e42  
    OP
       2021-07-02 20:42:23 +08:00   ❤️ 2
    @JQSM 儿童这个我是支持的这个没什么问题,因为似乎操作方法只是现有库匹配文件,这个问题不大。

    问题比较大的是 OneDrive 的这个操作要么 ML 了行为特征(如 @mschultz 所说匹配了后缀+文件数量),但是 ML 调参吗?调参会看到数据吗?是谁看到呢?这里想象空间有点大。当他说“industry-leading data protection technology”的时候我第一反应是至少我的文件名肯定是被 ML 了,但是我并没有希望它做这个 ML 更不要它这个保护

    服务商能看到这个没问题,问题是应该要符合一般的流程并且需要审计(我是付费用户,这里根据 MS 的逻辑我应该是数据的拥有者),像 Google 我也知道你能看到,但是他的客户数据访问都是遵循一定的流程进行的,虽然产品稀碎,程序正义这点上还是做到的
    skinny
        10
    skinny  
       2021-07-02 21:44:28 +08:00   ❤️ 4
    不要说什么数据的拥有者这种话了,人家那么一大串用户协议条款也不是法务部闲得没事硬凑的
    loveour
        11
    loveour  
       2021-07-03 00:15:07 +08:00
    @JQSM #6 我是肯定支持封禁儿童相关的。不过,说实话,我有时候有点担心我下载的某些图集里面不小心混有相关内容。还有日本的一些动漫感觉很有嫌疑。
    tesorouo
        12
    tesorouo  
       2021-07-03 05:54:51 +08:00 via iPhone
    @skinny 两回事,哪怕你一样的条款实践上如何使用用户数据依然可以有巨大差异,国内 BAT 360 哪个不是有长串的法律条款干嘛还被骂这么惨啊
    yujiang
        13
    yujiang  
       2021-07-03 08:40:45 +08:00 via Android
    上传即代表受到审计,强私密需求那还是自建 nas 吧
    ronman
        14
    ronman  
       2021-07-03 08:43:47 +08:00 via Android
    @emberzhang 单说相册的话,onedrive 只是部分云端,网页版只能识别物体和地点。而更多的功能,比如人脸分类之类的都是本地运算的,这个你打开相册 app 就知道了,每台电脑的识别结果还有点差异
    fl2d
        15
    fl2d  
       2021-07-03 09:27:42 +08:00
    gmail 也扫描所有附件。
    所以无法扫描的加密附件,时常被 gmail 拒收。
    Foxkeh
        16
    Foxkeh  
       2021-07-03 11:17:38 +08:00   ❤️ 1
    一直都有审查的。
    08 09 年刚出来一两年的时候(当时还叫 SkyDrive),我一个朋友上传福利图片直接导致服务被封了,后来用英文写了份申诉,客服用中文邮件回复说此次解封,下不为例,解封后数据都在没有被强制和谐。
    yfugibr
        17
    yfugibr  
       2021-07-03 12:05:38 +08:00 via Android   ❤️ 2
    说一下我个人经历,不知道是不是偶然情况。
    前几个周,使用 onedrive 上传一个网络安全相关的 ppt:
    开始试了好几次都上传失败(能看到进度条拉满卡住,网页端去看没有文件);
    检查后抱着试试看的心态,删除了两页仅仅是提到相关政策并且附有现领导人图片的 ppt,再次上传,成功;
    再把 ppt 改回去,上传,和第一次一样,进度条 100%的时候卡住,上传失败。

    之后就弃用了。
    cairnechen
        18
    cairnechen  
       2021-07-03 12:23:58 +08:00
    @8e47e42

    「操作方法只是现有库匹配文件」来源请求

    另外其实只要他能做到找出儿童相关的那些,剩下的就完全是信任与否的问题,比如之前 QQ 聊天会话中的关键词匹配到搜搜,很多人的结论都是腾讯实时监控着我的聊天。

    苹果说我没有,谁能证明呢?毕竟你能做到 AA 了,同时做到 BB 也不能算凭空怀疑了
    dfkjgklfdjg
        19
    dfkjgklfdjg  
       2021-07-03 13:24:43 +08:00
    个人意见,上传到云既默认会被看到数据,敏感文件还是自己本地保存或者 NAS,只是有些厂会和你说,有些厂默默的就把你文件扫了,不管是扫文件名还是扫后缀,还是始别内容,用户根本不可控。
    8e47e42
        20
    8e47e42  
    OP
       2021-07-03 21:13:22 +08:00
    我其实需求很简单。。自己多年龄段的照片不想被 ML 学人脸。。所以加密上传到云端备份,因为不算是非常私密的数据(看就看了无所谓),结果被换一个方式 ML 了,就是给大家提个醒
    whrssl
        21
    whrssl  
       2021-07-03 23:10:47 +08:00 via iPhone
    @yfugibr 所以,很想知道在中国国内使用 onedrive,数据是存储在国内还是国外的微软服务器上?
    yfugibr
        22
    yfugibr  
       2021-07-04 01:00:09 +08:00 via Android
    @whrssl #21 我的裸连速度很慢,只能认为是国外,世纪互联的数据好像是在国内
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2831 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 09:19 · PVG 17:19 · LAX 01:19 · JFK 04:19
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.