V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
TheWalkingDead
V2EX  ›  问与答

官方有没有可能有这样一个数据库?

  •  
  •   TheWalkingDead · 2022-07-20 12:50:29 +08:00 · 5990 次点击
    这是一个创建于 889 天前的主题,其中的信息可能已经有所发展或是发生改变。

    记录了所有人在网络上发表过得透露过自己观点的记录?毕竟后台基本是实名的,由手机可以映射到身份证等,比如某人某时发表过“争议性敏感性”话题或留言评论等等,然后被人工或者模型扫描到并入库?后续某一天,比如公务员政审等,把记录拿出来看?感觉技术实现很简单啊。

    65 条回复    2022-07-21 17:06:39 +08:00
    GeruzoniAnsasu
        1
    GeruzoniAnsasu  
       2022-07-20 12:52:06 +08:00
    有没有一种可能:
    equationl
        2
    equationl  
       2022-07-20 12:56:07 +08:00
    那你问问公务员政审不过的那些人不就知道了
    imdong
        3
    imdong  
       2022-07-20 12:57:04 +08:00 via iPhone
    有没有可能这个帖子不是发表在“水深火热”的。
    brblm
        4
    brblm  
       2022-07-20 12:59:16 +08:00 via Android
    明天到 xxx 部门上班
    Building
        5
    Building  
       2022-07-20 13:04:26 +08:00 via iPhone   ❤️ 7
    感觉技术实现上很简单啊……发明健康码的人一定觉得自己是个天才,直到自己哪一天变成红码
    hidemyself
        6
    hidemyself  
       2022-07-20 13:04:53 +08:00
    没可能
    kop1989smurf
        7
    kop1989smurf  
       2022-07-20 13:07:28 +08:00
    以下只讨论技术:

    这其实就是用户行为统计和用户画像。
    只要是 to C 概念的,各家都在做。否则 app 厂商对于产品改进,效果考核的关键指标怎么来。
    “我知道全中国哪个省的罩杯最小”——马云
    djoiwhud
        8
    djoiwhud  
       2022-07-20 13:16:27 +08:00 via Android
    有。这个叫智慧城市。智慧公安。
    luob
        9
    luob  
       2022-07-20 13:23:28 +08:00   ❤️ 1
    这方面不用多操心。如果你能闹上热搜,不管是国内的还是国外的,都会留下相关记录。如果你没闹出来动静,显然没有任何资源和技术支持这么干。
    lueluev
        10
    lueluev  
       2022-07-20 13:26:05 +08:00
    我记得有,网信部就管这个
    sujin190
        11
    sujin190  
       2022-07-20 13:30:00 +08:00 via Android   ❤️ 11
    这个最大问题估计你把自己想的太重要了,实际是根本不值得为你花这么多成本,这个世界绝大多数的重要程度根本值得监控分析,不是做不做得到的问题,国家对监控你估计还没有淘宝对你的兴趣大
    cpstar
        12
    cpstar  
       2022-07-20 13:32:08 +08:00
    若要人不知,除非己莫为

    没有一个数据库专门这么记录,但是必要的时候可以进行关联。
    find
        13
    find  
       2022-07-20 13:39:48 +08:00 via iPhone
    @Building good
    TheWalkingDead
        14
    TheWalkingDead  
    OP
       2022-07-20 13:53:18 +08:00
    @sujin190 单独的看每个人,是大海里的一只鱼那么渺小,不过捞一网,还是蛮壮观的啊
    THESDZ
        15
    THESDZ  
       2022-07-20 14:02:40 +08:00
    我觉得应该是必要的时候,去查的,而不是实时记录的,因为你根本没那么重要。
    BiChengfei
        16
    BiChengfei  
       2022-07-20 14:20:06 +08:00   ❤️ 12
    如果你是一个农场主,你会花钱监控你的猪牛羊今天干了什么吗
    lakehylia
        17
    lakehylia  
       2022-07-20 14:27:01 +08:00
    投入产出比极低
    docx
        18
    docx  
       2022-07-20 14:38:13 +08:00 via iPhone
    技术上可行,实际上较难操作。

    我认为更有可能是:
    内容由各平台自己管理,但设定风控等级,达到一定程度的用户会重点关照,再整理上报给官方数据库。或者各平台先留存,有关部门需要时拿着名单去调。
    si
        19
    si  
       2022-07-20 14:38:58 +08:00
    要查不都是直接去查的吗,聊天记录找腾讯查,上网记录找电信、移动查,要找什么平台的记录就找什么平台查。
    lmmortal
        20
    lmmortal  
       2022-07-20 14:55:50 +08:00 via Android
    技术上可行但我感觉实际不存在,毕竟健康码这么简单都做不到全国互认
    crab
        21
    crab  
       2022-07-20 15:24:06 +08:00
    网络发表这类没什么参考意义吧。言论可以伪装又不用付出什么。
    glfpes
        22
    glfpes  
       2022-07-20 15:30:47 +08:00
    不需要你主动输入的文字,只需要你的具体行为。点击,浏览,时长,点赞,收藏,包括搜索,还有你主动输出的文字,图片等等。你的行为会非常丰富,导致你的特征非常丰富。
    要求各大网站主动把这种原始数据清洗准备好,定期灌库 ZF 的数仓
    然后 ZF 雇佣一批人,可以给你打 1 个分,表征你的反社会倾向。
    卡阈值对高危人群进行人身监控。
    binux
        23
    binux  
       2022-07-20 15:32:44 +08:00 via Android
    @BiChengfei 别说会跑会动的猪牛羊了,就是后院的黄瓜西红柿我都有监控!
    HeyWeGo
        24
    HeyWeGo  
       2022-07-20 15:33:22 +08:00
    之前有个单位做的类似东西,舆情监控。

    汇总各个平台接受到的用户反馈,统计手机号在本地的停留时间判断是否是外来人口或常住人口,把人员流动情况和城市警情做关联分析。
    Felldeadbird
        25
    Felldeadbird  
       2022-07-20 15:41:30 +08:00
    技术可行。但是实际上存储数据量过于庞大了。收益只是针对政审,有点大材小用。
    TimePPT
        26
    TimePPT  
       2022-07-20 15:55:53 +08:00
    提出这样想法的人,显然不了解宣传审查机制的运转逻辑
    justfindu
        27
    justfindu  
       2022-07-20 15:57:10 +08:00
    没可能, 投入过大. 但是大单位的舆情检测肯定有的.
    justfindu
        28
    justfindu  
       2022-07-20 15:58:37 +08:00
    网信只会管理重点单位. 而且只会是某些关键词,关键舆情信息. 其他意义不大. 并且这个监测基本都是靠爬. 所以频率很低
    terence4444
        29
    terence4444  
       2022-07-20 15:59:50 +08:00 via iPhone
    查身份证的那个设备就可以显示出你的身份证备注
    lookStupiToForce
        30
    lookStupiToForce  
       2022-07-20 16:14:28 +08:00
    市面上就有一堆抓了微博存档留作他用的公司(当然都是文字信息),别提新浪自己肯定有对公接口提供这方面数据。这技术是真没啥难度,就看你是不是重点关照对象了
    7zlid
        31
    7zlid  
       2022-07-20 16:15:17 +08:00 via Android
    肯定有的…
    peaksnowcn
        32
    peaksnowcn  
       2022-07-20 17:42:13 +08:00
    @glfpes 那完蛋了,围绕我的都是一些情色资讯,我的口味都被记录在案,等等 浏览时长?我的时长也。。。。。
    不堪入目。。。
    dqzcwxb
        33
    dqzcwxb  
       2022-07-20 17:55:13 +08:00
    不损失利益或者既得利益时,我不希望被监控我需要隐私
    利益被侵犯时,一群吃干饭的这么点事都解决不了查个人有这么难吗?
    mringg
        34
    mringg  
       2022-07-20 17:57:25 +08:00
    国图就保留了微博的记录
    keith1126
        35
    keith1126  
       2022-07-20 20:14:40 +08:00   ❤️ 6


    此贴终结
    haodingzan
        36
    haodingzan  
       2022-07-20 21:31:39 +08:00
    完全没有必要,协查函发给各公司,返回最多有效数据的和最快响应的,匿名重奖。
    erquren
        37
    erquren  
       2022-07-20 21:57:52 +08:00
    @BiChengfei 放一个监控,有问题得时候拿来查
    Jooooooooo
        38
    Jooooooooo  
       2022-07-20 22:01:01 +08:00
    其实现在有类似的, 某些部门能查到的信息超乎你的想象. 不要抱有侥幸心理.
    dandycheung
        39
    dandycheung  
       2022-07-20 22:12:22 +08:00 via Android
    @BiChengfei 这个比喻不成立。毕竟由于你跟猪牛羊不是一个语言体系,导致你根本没兴趣知道它们是不是在骂你,或者合计什么别的对你不利的事情。
    kingjpa
        40
    kingjpa  
       2022-07-20 22:52:45 +08:00
    和你税务情况一样, 数据永远存档, 如果有需要直接倒查历史记录。
    只是现阶段没必要
    nyxsonsleep
        41
    nyxsonsleep  
       2022-07-20 23:00:43 +08:00
    真实情况难道不是莫须有?压死地上的蚂蚁需要理由嘛?
    躲猫猫也是有人身安全风险的。车厘子果核都有氰化物,说不定吃到变异植株呢,直接给你火化咯。
    没个官身,到头一场空。
    qsmd42
        42
    qsmd42  
       2022-07-20 23:49:00 +08:00   ❤️ 3
    这帖子里说没必要或者技术上不可行或者投入产出比太低的...真的是对自己生活的社会有点太无知了...
    针对特定民族的人脸特征识别还有步态识别什么的都搞了好些年了吧 基本都是公家招标项目 这些系统会是相互孤立的吗 在搞这些项目的同时又有多少配套系统在研发中呢?
    jdgui
        43
    jdgui  
       2022-07-21 00:18:10 +08:00
    技术上可以实现,但是你不值得。
    理论上来说,有这种乱七八糟想法的人只占很小很小的一部分,然后付诸行动的是更小更小的一部分。
    而且真出事了,人家直接找网站运营商就好了,为啥要提前预判一个手无寸铁的人。
    Windelight
        44
    Windelight  
       2022-07-21 01:02:52 +08:00 via Android
    也就几十亿个等待清洗的数据吧..........
    就这样的要求其实不高: http://www.ccgp.gov.cn/cggg/dfgg/gkzb/202206/t20220602_18009893.htm
    福彩甚至还把改号码的事(某地专线网络故障,晚上传销售信息,导致开奖两个小时。改号码是网友揣测。)都作为例子举例
    http://www.ccgp.gov.cn/cggg/zygg/zbgg/202205/t20220518_17927960.htm
    em70
        45
    em70  
       2022-07-21 01:07:55 +08:00
    这个机制不难,但需要社区运营商主动提交数据给官方,一个社区告诉官方今天我们社区有 10 万条反动言论,明天又有 20 万,官方会想不如把你关了算了,所以社区就没有动机如实提交数据,因为也没有监督,这个机制就没有作用了
    imycc
        46
    imycc  
       2022-07-21 05:52:19 +08:00
    理论上可以做,但没必要。发表敏感言论被网站自动删帖的太多,而要进入系统的人就那么些,不值得做。至于更进一步的,可能有在做,但当下应该发展不到影视作品里那种乌托邦社会。
    Aoonthetop
        47
    Aoonthetop  
       2022-07-21 08:26:55 +08:00
    有的 我记得是公安部什么课来着 在上海
    qrobot
        48
    qrobot  
       2022-07-21 09:07:20 +08:00
    @BiChengfei #16 996.icu 的时候我就知道了, 所有的信息都会被单独的部门进行控制,在比如输入法输入的字符串也会触发检测, 更别谈 Wechat, QQ
    danhahaha
        49
    danhahaha  
       2022-07-21 09:23:16 +08:00   ❤️ 1
    估计是有的,担心成本过大的多虑了,成本再大,羊毛出在羊身上,gfw 成本大不大,不也里在那里么
    arvinsilm
        50
    arvinsilm  
       2022-07-21 09:33:14 +08:00
    十几亿实体的打标而已,用图谱连关系都给你做出来。诸位觉得成本太高的是认真的吗?这种系统的预算都是亿为单位上不封顶。而且还可以几乎无限制的调用各个互联网公司的接口,甚至要求定制接口。怎么就不可能了。
    1harry1
        51
    1harry1  
       2022-07-21 09:41:08 +08:00
    监控所有人效率太低,我猜测是有类似风控系统,你的行为触发风控后,开始收集动作
    yunyuyuan
        52
    yunyuyuan  
       2022-07-21 09:45:08 +08:00
    @BiChengfei #15 嘿嘿,牛羊不会 revolution
    winglight2016
        53
    winglight2016  
       2022-07-21 09:45:35 +08:00
    @arvinsilm 的确,这种系统仅仅取决于地方政府的预算,而且不同部门还可能各建一套,然后再来个数据融合平台的大项目
    jink2018us
        54
    jink2018us  
       2022-07-21 09:55:24 +08:00   ❤️ 1
    这取决于 1 有没有需求 2 能不能实现。
    对于 1 回忆一下档案这个东西,说不定里面有你的黑材料,计算机还没在我国普及时我们的 zf 就有这个需求了。
    对于 2 现在大数据都能精准杀熟了,你说能不能实现。。。
    12 都具备了你说会不会有这个东西。就算目前没有也马上会有了。
    westoy
        55
    westoy  
       2022-07-21 10:03:13 +08:00
    社区都有常住人口的粗略人物画像
    c0nstantien
        56
    c0nstantien  
       2022-07-21 10:37:55 +08:00
    用区块链可不可以,还没法篡改
    linksNoFound
        57
    linksNoFound  
       2022-07-21 10:50:11 +08:00
    事实是各部门的数据不互通
    扯皮的情况多了
    sprite82
        58
    sprite82  
       2022-07-21 10:51:41 +08:00
    @BiChengfei 会的,不要让他们运动太多,免得吃太多,或减少体重
    libook
        59
    libook  
       2022-07-21 11:15:38 +08:00
    没必要,存那么多数据成本太高了,而且你还得随着各家平台的迭代来更新数据结构和查询算法,不如让各个平台来维护。只需要打通各个平台的审查通道,有技术能力的可以让各平台提供特权 API 做个聚合查询,需要审查某个人的时候直接从各个通道查就好了。

    这套在任何网络建设比较成熟的国家都有,比如大名鼎鼎的棱镜计划。
    外国公民申请签证的时候也会查,比如申请美国签证的时候也会查你的社交账号,看有没有美国 zf 认为的敏感词。
    liveoppo
        60
    liveoppo  
       2022-07-21 11:15:47 +08:00
    可以说这是必然的。没听说“社会治理精细化”?
    人口无论多少都是固定的,计算力提高一下即可轻易覆盖
    smallthing
        61
    smallthing  
       2022-07-21 12:07:53 +08:00
    @Building 这样说话没什么意思。任何技术都有利弊,前期他就是起到了很重要的作用。
    Jojoy
        62
    Jojoy  
       2022-07-21 12:22:48 +08:00   ❤️ 1
    知道你们降工资了,即没钱也闲得慌,所以只能出来发点这种钓鱼的帖子找找存在感;

    这里送你们一句话:
    Tuuure
        63
    Tuuure  
       2022-07-21 12:28:23 +08:00
    政审还要亲自跑去居住地派出所要无犯罪记录证明呢,我是不太相信存在这么高端的系统
    ByteCat
        64
    ByteCat  
       2022-07-21 13:58:17 +08:00
    你是否在找:棱镜计划
    我觉得每个地方都会有
    exploreexe
        65
    exploreexe  
       2022-07-21 17:06:39 +08:00
    我一直有个想法就是,为什么网上造谣的事情,有关部门很快的就能定位到谣言的出处?是不是一条简单的 select 查询就可以查出来。
    那么微信群里造谣的,怎么能够快速的定位到这条消息的最早出处?如果按 TX 说的,他们不存储聊天记录,那么这是怎么定位的?他们不存了,是不是有些地方在存,这只是个文字游戏?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1069 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 19:15 · PVG 03:15 · LAX 11:15 · JFK 14:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.