比如说 你在 v2 或者在微博 发一个帖子 发一个图片 小粉红和网警是看得到的.反手一个举报.信息封控就完成了.
任何关键词混淆都是没用的.因为这是直接人眼识别
因为这些都是公共社区.所有人都可以进.
但是抖音现在的技术 可以做到私密的信息流.就像 TG 的私密频道一样.而且比 TG 的私密频道还要保险. 因为这种私密的信息流是不依赖邀请制度的.只要通过了抖音的大数据判定 你是属于这个私密信息流的人 才会让你进去
比如 按照性别的信息流.只有判定了你是男性.你才会来到这个男性专属的信息流. 一个专门讨好男性的视频(典型的各种段子嘲讽大龄剩女要求高)就只会推送到男性.不会推送给女性用户.
反动视频只会推送给反动派.不会推送给小粉红
只要抖音有这样的意愿.然后技术上能够做到精准的用户画像.那么这种私密的信息流要如何封杀控制?
一方面是可以蜜罐钓鱼.伪装.比如一个男性用户可以伪装成女性用户. 那要如何伪装呢?这个男性用户会按照他对女性用户的理解去伪装. 比如只点赞那些他认为女性用户会喜欢的视频.各种帅哥 各种讨好女性的话术(女人应该像公主一样被宠爱).
但是这样的一种伪装能不能成功呢?抖音对于女性用户的理解是绝对强于普通人的.因为抖音的数据多.抖音会知道一个真实的女性用户有什么样的特点.比如可能会出现月经痛经相关的搜索.讨论 hpv 疫苗相关的.
还有其他更加偏门一点的特点.就是只有抖音的机器人经历那么多的数据之后留下了的特征标记.
其他人是无法知道的.
所以这样的一种伪装.这样的一种技术上的对抗.抖音的机器人是完全碾压的
第二种思路.就是随机抽查(效果有限)或者每一个视频都看一遍(需要的人力很多).而且这种思路是 O(N)的.每天新增的视频数量越多 这个方法就越差
大家有没有其他思路
1
kindjeff 2022-07-12 11:53:06 +08:00
伪装很容易成功,我曾经就试过用一台新 iPhone 训练,让抖音误认为我是一个老年人,刷了很多震撼我三观的视频,并且持续了一段时间。
训练方法主要是模仿观看习惯,包括观看时长、循环次数、分享习惯(有些直接分享到微信,或者假装给身边的人看,这时通常会往下刷一下再刷回来以便从头开始放) 不过这个需要坚持,不如不是刻意为了训练它,我没有办法看一个逆天老年人剧情向视频超过五秒。这样的话只要一两天抖音就会重新推送我真正喜好的东西。 --- 我觉得这个「私密圈子」没有楼主想的这么牢不可破(不过这样发展下去迟早有一天会变成这样)。 |
2
czfy 2022-07-12 11:55:00 +08:00
合着你就是来讨论怎么更好地做审查的?
那滚吧 |
3
v23x OP |
4
murmur 2022-07-12 11:59:05 +08:00
说这些玩意你的意图是什么,比如是 b 站,假设你喜欢看女装和化妆的东西,那你直接搜索就可以了,为什么要跟自动推荐对抗
搜索、tag 、分类这些功能是摆设么? |
5
kop1989smurf 2022-07-12 12:00:26 +08:00
假设一个平台完全依赖于内容推送,其实就相当于一个独断专行,自我进化的内容分发系统。
外部审查确实比较困难。 所以更多的是依赖内部审查和抽查。 比如每个维度抽查几个 tag ,一旦某些 tag 的内容偏向极端化(这是媒体逐利的必然),就开始针对某个 tag 进行清洗。 |
6
westoy 2022-07-12 12:02:09 +08:00 4
想多了, 四五年前抖音官方就说过审核团队就有几千人的, 审核团队介入前还有 shadownban(仅自己可见)和 AI 自动删除的分档屏蔽, 之后还以后系统内举报
信息茧房的软屏蔽更类似海外平台的机制 国内平台并不能依赖这个, 因为不止小粉红, 竞争对手也会制造这种内容然后举报的, 依赖这个的结果就是被锤 |
7
kop1989smurf 2022-07-12 12:02:26 +08:00
而且还有一点,就是内容分发者其实并不能确定他的内容一定会被下发到其目的 tag (或者筛选维度)中,所以很大程度上上传者也会考量风险,自我审查。
|
8
v23x OP @kop1989smurf 所以前提是抖音本身要有这样的一个意愿.
如果有这么一群人想对抗信息审查.那么他可以按照这种用户画像的思路去筛选真正的同道中人. 只要机器学习到了一个的程度 就不会被伪装欺骗被捅刀子 |
9
kop1989smurf 2022-07-12 12:10:06 +08:00
@v23x #8 假设这个平台自身真的想搞一些偏门,确实是可以实现的,而且外部审查很难。
况且媒体引导,一直是舆论政治的主流做法,现在的媒体平台也在这么做(无论是西方还是中国)。 只不过平台因为趋利而没有选择对抗政 @府而已。 |
10
v23x OP @westoy 故意陷害然后举报 确实是一个需要注意的地方
比如网警可以故意构造类似的视频.然后发现没有被审核过滤.就去找抖音的麻烦. 但是这种也是可以破解的.因为这也是一种识别和准入. 你一个陌生人来到平台.突然就发敏感信息.这种是可以简单就识别出来的 必须要被系统信任了 你为反动派 你才会被接纳到这个私密的信息流里面来 才可以接收和发布对应的信息 |
11
kop1989smurf 2022-07-12 12:17:42 +08:00
@v23x #10 所以之前 tiktok 的模型问题闹的非常大。各国都不希望自己的媒体宣发模型被其他企业(或者说国家)所掌握。
|
12
v23x OP 这种系统比较难处理的是叛徒问题
假设一个恨 8 国 8 党 出身农村 家庭背景贫穷 经过自己做题的努力 一路拼杀到了大城市 每天 996 加班 身体熬夜一身病痛 今年已经 30 岁了 考公务员好几次都失败(还听过有各种黑幕) 没车没房 相亲总是失败 他恨透了这个状况 他对这个社会不满意 觉得很不公平 经过一年的视频点赞之后 他被抖音逐步筛选进入了恨 8 国 8 党的私密信息流中.一帮志同道合的人聚在了一起.他觉得信息流里面每个人讲的简直都是自己的心里话 但是突然 他考中了公 8 务 8 员 8.集团夏天给他发西瓜荔枝各种水果高温补贴冬天给他发米面粮油冷空气补贴 每个月公积金 6000 元.轻松首付买房(公 8 务 8 员可以零首付) 考上公 8 务 8 员第二天就相亲成功.买了车.每天早上 9 点钟上班 5 点下班.食堂 4 块钱吃一顿.营养丰富又美味. 集团提供 12 年义务教育(机关幼儿园到初中一路完全免费包括书本费) 那么这个时候他再来看抖音上私密信息流里面的视频就显得那么刺眼 这些整体发牢骚的人 只不过都是不努力只会埋怨集团的 loser 每天嚷嚷着这里不满意那里不满意 但是又不滚出 8 中 8 国 太平洋没有加盖 有本事你跑出去 不要留在 8 中 8 国 影响社会稳定 这个时候的他 已经成为了利益集团的一份子 维护这个利益格局的稳定(社会稳定) 是他的核心利益诉求 所有那些曾经看起来那么顺眼的视频 那些 UP 主 现在都显得那么不可理喻 于是 他愤恨地对这些视频进行了举报 集团根据他的举报 成功抓获了一大批 8 恨 8 国 8 党 摧毁了一个已经被 8 境 8 外 8 势 8 力渗透的 8 反 8 动 8 集团. 社会的稳定再一次得到了加强.人民的利益()得到了保护 面对这样一种基本无法预测.突如其来的政治图谱的改变.叛徒的发生. 系统很难处理这种状况.只能是快速止损.比如发现了类似举报之后.剔除叛徒.销毁证据.切割联系.等等 当然集团也不蠢.接到举报之后.有可能按兵不动.等到网住了一大批.才收网.一网打尽. 这样的一种叛变情况.如果是叛变比较慢.有征兆.那么还可以应对.提前发现.提前剔除出私密信息流. 叛变的转变特别快的话.就比较难处理了. 比如某个叛徒发现外面有悬赏.十万元人民币.让你举报这种反动的私密信息流. 那么这种情况下.系统就有可能被突破掉了. 所以这种反抗信息审查的系统.必须注意有限的切割.一个叛徒的出现.叛变.要让他的影响尽可能小范围. 这种小范围的实现.包括视频的过期处理.一个敏感视频在某个人的历史纪录中不长期保留.阅后即焚.这样就不会往前追溯 然后这种系统还必须不能有关注机制.因为关注机制等于用户可以自行标记哪些人是哪些成分.等到叛变的时候可以一起举报. 欢迎大家讨论.还需要注意哪些情况 |
13
realrojeralone 2022-07-12 13:28:54 +08:00
@v23x 没懂为什么都上 v 站了还自我阉割,主动规避墙内的敏感词
|
14
v23x OP @realrojeralone 因为发不出去 V2EX 提示我有敏感词.但是没有告诉我敏感词是哪些
|
15
Jwyt 2022-07-12 13:36:54 +08:00 1
@realrojeralone 那是论坛的敏感词,没想到吧
|
16
kop1989smurf 2022-07-12 13:39:06 +08:00
@v23x 这其实就是简单的用户画像误差问题。一个人因为个人原因,导致其喜好,利益关系,甚至是三观和系统既有的画像模型有偏差。
这时候对应赛道的从业者会失去这个用户,甚至会承受更大的损失。 这很正常。(比如我就对短视频平台有偏见,认为内容低俗,但因为工作原因接触了几个月,短视频平台在我心目中的形象有所改观。) 但你这个例子举得过于极端了。 因为当你发送内容给平台时,你要默认你自己可以承受其后果。 换句话说,你这个例子搞错了因果逻辑。 不是因为某个领域的受众倒戈,导致内容发布者受损。 而是内容发布者本来就选择了有风险的内容。 反之,如果是有不可承受风险的内容,你就不应该依赖一个自动分发系统。 |
17
wxiao333 2022-07-12 13:39:13 +08:00 1
我前几天看 NBC news 的新闻说 tiktok 可以通过前置摄像头看到你的肤色 种族 性别,建立用户画像的,不知道真假
|
18
hidemyself 2022-07-12 13:43:07 +08:00
可以关闭个性化推荐的
|
20
love642285 2022-07-12 13:50:42 +08:00
那我觉得小红书也是这样的私密信息流
|
21
v23x OP |
22
ScepterZ 2022-07-12 14:18:55 +08:00
你说的这些,微博好像也不是不能做,推荐和搜索的地方都过滤一下就好了
不过抖音也可以分享吧,这地方不能屏蔽 |
23
Jooooooooo 2022-07-12 14:30:42 +08:00
这个问题在国内不是问题, 在国外的 tiktok 确实是问题
人们会担心意识形态渗透, 抖音的说法是会邀请第三方对算法做审查 |
24
liudongdd 2022-07-12 14:41:45 +08:00 1
我去搜了搜草地雪山无责任公司,结果导向令人吃惊
|
25
realrojeralone 2022-07-12 15:01:59 +08:00
|
26
MrTLJH 2022-07-12 15:18:11 +08:00
我现在就伪装的很黄很色,免得给我推广告😂
|
29
cwyalpha 2022-07-12 17:02:32 +08:00 via iPhone
u2b 上有媒体对 tiktok 做过这个实验,招一些志愿者,让志愿者随机选一些兴趣爱好(比如 lgbt )然后只用刷视频的方式(感兴趣的看完,不感兴趣的刷掉),测试多久能 converge 到兴趣点,以及对于很偏门的兴趣点是不是都可以发现。。
|
30
yuzo555 2022-07-12 17:11:34 +08:00
抖音再怎么私密,每条视频还是会遵守基本的法律和阉割规则,违法和煽颠的视频首先第一步都不会过审。过审之后才会有各种信息流区分。根本不用担心审核问题。
|
31
AoEiuV020CN 2022-07-12 17:21:17 +08:00
道高一尺魔高一丈,靠谱的只能是直接审查服务器,所以 tiktop 服务器不能在国内,抖音服务器不能在国外,
|
32
xingyuc 2022-07-12 19:02:04 +08:00
理念不一样吧,微博动不动就弹框问你要不要关注下面的人,你不关注就偷偷帮你关注,抖音是全靠算法分析你想看的内容
|
33
cpstar 2022-07-12 19:18:15 +08:00
首先,还跟你搁这玩前端审查,图样图森破啊,人家直接上后台审查所有视频,当然并不能“完全”审查,这是审查算法问题
其次,从所谓的“私密信息流”来看,那又怎样,对审查有难度?那参看前者 再次,老话讲“若要人不知、除非己莫为”,一言一行,甭管是通过观看视频时间长短、分享评论情况还是别的其他,每一个行为都可以用于侧画,怕?那就别为之 最后,还是老话物以类聚人以群分,结合第一条第三条,对审查反而是件好事,一切都可以秋后算账 |
35
flyn 2022-07-12 20:35:46 +08:00 3
抖音我几乎不用,但是凭感觉楼主描述的这种情形也没什么危害。
反倒是之前脸书刚注册不久,就发现一个神奇的现象。 大体情况是新的脸书号注册后,本着方便进行事实核查的目的,一开始我就关注了一堆像是人日、驻外使馆、新华社、联合早报、RT 这样的和一些立场温和的大 V 账号,这还没什么异常。 用了一段时间后,我又关注了一些其它的诸如中时、三立、自由时报、苹果新闻之类的台湾蓝绿媒,这时候就发现,这些台媒账户的评论区许多立场反华、对中国恶语相向的言论被过滤掉了。但是退出登录,重新注册一个空账号,完全没有任何关注行为,打开同样的新闻,能看到的内容反而是多得多。使用谷歌快照也能看到比第一个账号多的评论内容。之后又翻了好久设置,也没找到关闭内容过滤相关的开关。 这就很恶心人了,虽然有些看着不适的内容,仇恨言论也消失了不少,但你这种反向 Shadow Ban 是个什么东西?我特么想尽可能多地获取信息资讯,而不是让平台故意制造信息不对称。 总之脸书我刚用不久就被劝退(距今有两三年了),而且今后完全不打算碰这辣鸡。 |
36
christin 2022-07-12 21:27:42 +08:00
少看点小说吧……
抖音的推荐系统其实很弱智的,只要你 10 个相关视频内表达出自己的意向就能给你打上标签推荐相关视频。 比如我自己,晚上我想看美女视频,那我碰到其他类型视频就跳过,看到美女视频就看完+点赞,权重再高点就分享,5-10 个美女视频操作下来后面的 80%都是美女视频。同理其他类型的也可这样操作。 或者你直接去搜索某个 tag 的视频,比如你去搜索钓鱼,在搜索结果里面浏览完 10 个视频+点赞,回到视频流里面大部分就都是钓鱼了。 目前国内外的平台看下来,只有 b 站的推荐机制比较弱智,其他的都可以用这样的方式来修改你的画像。 |
37
MoonQiu1342 2022-07-12 21:32:51 +08:00
抖音在用户画像这方面做得是非常好。
由中国出海的 TikTok ,按理来说一个 App 从零开始是无法取得如此大的成功,尤其是在 YouTube ,Instagram 这类 Social Media 垄断市场的局势。 同样,小红书,知乎这类也是主要依赖内容推送。举一下我个人的例子吧:知乎上,我接收到的信息近乎完全趋近「科技」,「润学」,这可能是因为我之前长时间研究加拿大,美国移民;而我小红书则是类似女生的推送「服饰」,「基础电脑问题(比如 MacBook 要下什么软件,家人们),这可能是我不怎么使用小红书,而导致小红书对我画像缺乏。 那我说说知乎吧,因为知乎是我在几个 App 中最符合你说的「私密信息流」。比如问题「全国政协委员建议引导未成年人正确看待运用网络语言,建立网络语言负面清单,此举会带来哪些影响?」中有一个回答「建议直接使用正面语言白名单」,这是我默认排序第一的回答。 很巧的是,知乎回答查看只提供了默认 /时间排序,因此,我在「默认排序」中往下划了很多,才找到另一派别的回答「这横看竖看,说的都是担忧学生遣词用字的问题,和当年看着我们这一代人用“火星文”“数字文”产生的那种担忧一样。只是夸大了互联网的影响。」 而前者「白名单」底下的评论则基本是阴阳怪气反 CN 的,这应该属于「私密信息流」。 而对抗算法,则会因为个人一点点不同的习惯,导致算法发现真实意图。我重置手机再使用的抖音在两天内就接近我的兴趣了,这在我有主动意识对抗算法的前提下。 所以,无论抖音知乎,靠信息流推送的平台很难被主动监管到,也逐渐形成了「私密信息流」,而「私密信息流」难以被捕获,除非用更高一级的算法或经过训练的刷视频,我认为这两个都比较难达到。 |
38
abc8678 2022-07-12 23:12:51 +08:00 via Android
看来看去全是个性化,各大 APP 都看腻了。有时候想搜些新鲜的东西,但脑中没有新点子了,想不出什么花样来了。只好找词库,但除了输入法和字典,好像并不能找到各个领域的词(就像 V2EX 的节点栏那样)
|
39
jink2018us 2022-07-13 02:37:43 +08:00 1
你想说啥呢?原理就是给用户画像,用户对策就是给画像投毒。
抖音之类的用机器学习,用户也用机器投毒对抗才是正道。就是现在不知道有哪些机器投毒方案。 |
40
Perry 2022-07-13 02:52:10 +08:00 3
网警:管你什么信息流,新上传的视频必须一个个都得审核过去。
|
41
Zien 2022-07-13 03:43:19 +08:00 via iPhone
以前微博不就是信息茧房吗?现在审查举报是无处不在的,早就被攻破了。感觉可能和举报成本有关。
|
42
JRyan 2022-07-13 07:37:40 +08:00 via iPhone
抖音里有很多输出价值观的,有些对人的思想影响很大,对没有独立思考的人来说极易被煽动,特别是老人,这种是没法审核的。
|
44
rrZ2C 2022-07-13 09:02:04 +08:00
抖音推荐不光看看内容,对人群的划分也是非常重要的一环
所以想训练抖音推荐正好符合自己口味,其实很难的......往某个类型群体上靠就容易些 |
46
bk201 2022-07-13 09:23:04 +08:00
我语文不好,没明白作者想表达什么。抖音的审核屏蔽能力是强于微博的,微博你可以一瞬间看到,甚至被爬虫爬到记录下来,抖音能将一系列的相关视频降权甚至屏蔽。
|
47
winglight2016 2022-07-13 09:41:07 +08:00
lz,你管抖音里推荐的视频,叫”私密信息流“?
至于举报,我感觉,如果没有现金奖励,小粉红大概也懒得点举报 |
48
davin 2022-07-13 09:42:28 +08:00
看了半天没看懂,还有全篇的英文符号,影响阅读理解。
|
49
zxcslove 2022-07-13 09:55:49 +08:00
养殖业者肯定要尽量减少畜禽打架导致的损耗
|
50
treblex 2022-07-13 10:07:58 +08:00 via iPhone
还以为是区域性封锁限制分享转发吗,那个功能确实有点儿东西
推荐机制来说,比 b 站好很多,一个视频没来得及滑走,多看两秒,接下来就疯狂推🫠 |
51
ecloud 2022-07-13 10:20:27 +08:00
你为什么要装抖音这种垃圾软件?
|
52
v23x OP @MoonQiu1342 我个人的使用体验来说这种用户画像或者个性化推荐来说 要想做好非常不容易.不然 B 站和 YouTube 为什么做得这么差?YouTube 的视频推荐体验简直是弱智到了反人类的地步.连专家系统都不如.别说 AI 推荐了.
知乎的个性化我也体验过 比抖音差多了.知乎推给你的内容会让你一下子非常厌倦.因为全是一个很狭窄领域的一大堆内容.感觉就是很简单的 tag 算法.你喜欢某个 tag.就全部推这个 tag 下面的内容给你.就是一个简单的 RSS.什么用户画像.根本没有. 抖音能成功不是没有原因的.国内的内容服务都做得太差了.豆瓣和知乎不说了 最基本的速度都做不到.每次网络能卡成傻逼.微信的公众号也做得很差.好内容的发现很困难. |
53
NeezerGu 2022-07-13 10:48:33 +08:00
我没有理解错的话?这就是推荐算法??
这不是机器 /深度学习书一般第一课讲的东西吗? lz 是想说什么?抖音的推荐很牛?还是啥? |
54
murmur 2022-07-13 11:11:40 +08:00 1
@treblex 如果一个 app 都是低质量视频,那怎么推荐你都认为好,b 站是长视频网站,长视频的质量高低之间至少差 10 倍都不止
|
55
murmur 2022-07-13 11:14:20 +08:00
@bk201 这个应该是被迫吧,视频的创作速度是比文字慢的,文字快的跟聊天差不多,每条都是先审后发,而且是 AI 严格审核,那干脆就不要开了,负载都放在审核系统了
|
56
murmur 2022-07-13 11:22:36 +08:00
另外抖音那个不叫审核,叫阉割,微博审的还只是敏感信息,抖音是不让人好好说中文
|
57
vzchn 2022-07-13 11:27:49 +08:00
控制人家是直接在源头上控制,上传上来就检查了,还等你分发?
|
58
murmur 2022-07-13 11:29:28 +08:00 2
居然有人在吹抖音的审核,也是第一次见到,我举个例子
抖音能成功不是没有原因的.国内的内容服务都做得太差了.豆瓣和知乎不说了 最基本的速度都做不到.每次网络能卡成傻逼.微信的公众号也做得很差.好内容的发现很困难. 这句话在抖音里得写成 DY 能成功不是没有原因的.G 内的内容 FW 都做得太 C 了.DB 和 ZH 不说了 最基本的 S 度都做不到.每次 WL 能 K 成 SV.WX 的 GZ 号也做得很 C.好 NR 的发现很 KN. 大概就这样 |