文章
技术

网络冲塔技术分析(兼人脸识别科普

rebecca  ·  2020年12月16日 我不是品葱的神,但是后来发生了一些事情

原帖:https://pincong.rocks/article/14049 作者是我,但是我被新品葱封号了


贝卡:大家好,我是丽贝卡,在品葱的用户名是rebecca,今天跟大家从技术角度谈一下网络冲塔。

舒克:你说到这个冲塔,我身边的很多朋友都有在知乎、微博、QQ上冲塔,因为我们相信冲塔能够早日推翻共匪、实现民主。

贝卡:没错,目前国内每天都有大量网友加入冲塔的行列。我本人是做人工智能研究的,对中国的各种监控技术都有比较深入的了解,对冲塔这件事,希望能够给大家提供一些专业视角。

舒克:admin之前就怀疑你是网警。

贝卡:不,我不是网警。

舒克:不不是国安,我记错了。

贝卡:我也不是国安。之前品葱有一个用户自称他是国安(对内保防侦查局),但那个不是我。我祝全体国安在监控室值班到天亮然后英勇牺牲。

舒克:行吧。我的第一个问题是,网络冲塔真的有效果吗?能争取到民主和自由吗?

贝卡:【争取民主自由】就是提升一个人的政治权利。我之前率领我们统计局的同志做了一个问卷调查(https://pincong.rocks/article/13684),调查显示品葱用户认为【公开发表自己的观点】是最能够提高一个人政治权利的做法。在墙内公开发表自己的观点,其实就是所谓的冲塔。

舒克:看来大家都是支持冲塔的。

贝卡:但是网络冲塔性价比很低。现在注册一个账号,手机号验证,冲一次塔就没了。相比之下,审查机构封你的号要轻松得多。

舒克:能不能详细解释一下?

贝卡:在微博注册一个账号,不计金钱成本,按正常人的手速来算,平均要花1分钟时间。而人工智能筛选+人工封号,一个控评师一分钟可以封100人。如果是纯人工智能筛选,一分钟封十万人都没有问题。

即便不封号,你一个人冲塔的时间也是有限的,不可能24小时连续工作。但网评员和网评机器人就不一样了,他们是24小时在线,只要你冲塔力度稍微减弱,你的声音很快就淹没在忠党爱国的汪洋大海里了。

所以冲塔是非常不划算的做法。你今天可能唤醒了100个粉红,但是明天这100个人看到的又是网评员带风向的内容,又被染回了粉红。对于这些人,除非你能坚持每年唤醒六个月,否则是不会有什么效果的。

舒克:我懂了,怪不得美国绿卡持有者离开美国不能超过六个月。

贝卡:没错,就是怕你在别的国家待太久,被人洗脑了,回到美国做不利于美国的事情。

舒克:明白了。我的第二个问题是,冲塔的时候,修改关键词是不是就可以避开审查了?比如说我不提习近平,我说“翠”,这样微博就检测不到了吧。

贝卡:你这个办法在人工智能技术起飞之前是管用的,现在人工智能技术发展得很快,所以修改关键词也逐渐地不管用了。

舒克:能不能详细解释一下?

贝卡:比如说你在央视微博下面留言说“翠”,同时还有几万个人也在下面用各种方式骂习近平。虽然人数很多,但是用来暗讽习近平的词数量其实是很有限的,比如说维尼,庆丰,包帝,宽衣,闹得欢,翠……加起来不到一百种。

这个时候,控评师需要做的,就是先把其中1条评论标记为反动言论,比如说“翠”。然后软件就会把你之前一段时间的留言都统计一遍,发现你经常说“今后统统拉清单”之类的话。然后软件会把央视微博下面所有留言里提到“翠”的网友之前一段时间的留言都统计一遍,发现这些人也经常说“闹得欢拉清单”之类的话。最后软件就得出结论,“拉清单”有99%的几率跟“翠”一样是反动言论,于是包含“拉清单”或者“翠”的评论就会全部被删除,相应的网友警告或者封号。

暗讽习近平的每一种表达方式,只要使用的人数足够多,都会被软件通过上面这种方式分析出来,控评师只需要抓几个典型,剩下99%都是计算机自动完成的,所以效率特别高。

舒克:这对普通人也太不公平了。

贝卡:没办法,知识就是力量。

舒克:那我可以把翠字藏在一首诗里面。翠是一个常用字,他总不能连常用字都封杀吧。

贝卡:你如果把翠字藏得太好,大家都看不懂,就达不到冲塔的效果了,所以你还是要讲得明白一点。问题是现在人工智能很强大,以阅读理解为例,OpenAI搞的那个GPT-2,做阅读理解的能力比绝大多数普通人都要强(虽然答案不是很准确,但速度超级快)。

换句话说,只要大部分的人能分辨出你是在侮辱圣上,人工智能也就能分辨出来,根本躲不掉。

舒克:我把国歌的第一句发出来冲塔,他要是敢封,以后就连国歌都不能发了。

贝卡:过两天他就真的把国歌给你封了。不唱国歌不影响生活,也不影响共产党的统治。

你不唱国歌也不会有什么问题,但是你能不用人民币吗?你生孩子能不登记户口吗?你东西被人偷了能不找警察吗?你上班打工能不用微信吗?

(而且习近平连宪法都可以改,大不了就把国歌也改了。)

总有些人以为言论是共产党的睾丸(坎通话叫“春袋”),一捏就痛,实则完全不是的。在共和国的历史上,企图通过言论挑战共产党统治的普通人,最后下场基本都非常悲惨。

言论不仅不是共产党的命门,甚至应该说是共产党最擅长的工作,我们不应该拿自己的短处去跟共产党的长处硬碰硬。

舒克:那么,有没有比网络冲塔性价比更高的方法呢?

贝卡:如果冲塔的每一个人,都戴上口罩,下楼捡一块砖头,扔到政府大院(或者中领事馆)里,对党的威慑效果比在网上冲一百次塔还要显著得多。我在这个领域干了这么久,还没有见过任何言论审查系统可以过滤砖块。

舒克:你说的不就是香港的街头抗争嘛。但是你也知道目前大陆没有街头抗争的条件,选择网络冲塔不是很正常吗?

贝卡:这就如同说,现在全世界都没有治疗新冠肺炎的药,选择双黄连不是很正常吗?

香港有言论自由,香港人如果要网络冲塔,比如在网上骂林郑月娥,根本就没有任何限制。但是他们还是要搞街头抗争,因为他们已经试过了,知道网络冲塔是没有效果的(有效果就不用街头抗争了)。可是很多大陆人还是对冲塔乐此不彼,他们认为自己是在加速、是在推动历史的进程。


(原文完。以下是回复网友提问节选。)

人工智能的专家能不回答一下关于面部识别和监控的问题呢?如果大家上街,然后政府通过摄像头辨别出来你是谁...

舒克:我还有一个问题,就是现在街上有很多摄像头,如果我被这些摄像头拍到了,政府能不能认出我是谁?

贝卡:能不能认出你是谁,第一是取决于城市的规模。假如你的城市只有10位居民,那么从10个人的照片里找哪一个是你,就非常简单;如果你所在的城市有1000万居民,要找到你就比较困难了。

舒克:能不能讲一下具体是根据什么来找的。

贝卡:人类的五官,鼻子有很多种,嘴巴有很多种,眼睛也有很多种,再加上位置也各不一样,所以人工智能算法可以把不同人的脸给区分开来。

舒克:老鼠的五官就没有那么多复杂的变化,所以鼠脸识别的效率就比人脸识别低吗?

贝卡:没错,难抓是我们老鼠的特点之一。

舒克:那如果是双胞胎,长得一样呢?

贝卡:人类双胞胎的发生率只有千分之四,而且找到了哥哥其实也就找到了弟弟,所以对警察抓人影响不大。

舒克:就算人类的五官变化再丰富,1000万个人里面,总会有长得很像的人吧。

贝卡:根据【生日定理】,如果只考虑五官的变化,确实是这样。不过人脸除了五官,还有很多细节,比如说痣,痘,疤痕,发际线。所以即便是长得很像的两个人,脸上痣的位置也不可能完全相同,只要照片足够清晰,1000万个人里面也是可以分辨出唯一的一个人的。

舒克:那是不是照片不清晰的时候,人脸识别系统的效率就会下降?

贝卡:没错,人脸识别系统的性能的高低,跟输入图像细节的多少,有很大关系。

舒克:那么一般怎么衡量一个人脸识别系统的性能呢?

贝卡:我举个例子。有一个识别系统声称自己是【千一99.9,万一99.2,十万一98.5,百万一87.3】,意思就是说,这个系统从一千个人里面找一个人,找到正确的人的概率是99.9%,从一万个人里面找一个人,找到正确的人的概率是99.2%,以此类推。

舒克:那街边的摄像头一般是什么性能级别?

贝卡:这要取决于摄像头能够把你的脸拍得多清晰,以及数据库里你的脸有多清晰。如果是身份证照片那种清晰度,目前最好的系统(给公安抓人用的)性能在十万一99左右。

舒克:这么厉害?公安真的用这个系统抓过人吗?

贝卡:公安在招标的时候,就会让系统供应商们来比赛,由公安提供监控摄像头的录像和通缉令的照片,然后系统供应商从浩如烟海的监控录像中找到被通缉的犯人。现在国内人工智能行业最赚钱的业务都是面向公安的。

舒克:我听说人工智能都是要用很贵的超级计算机来运行的,街边的摄像头有这么厉害吗?

贝卡:街边摄像头拍到的画面,会通过网络传到公安的云上,而高精度的人脸识别都在云上进行。

舒克:把高清视频通过网络传回来,这得要多大的带宽呀,还有网费谁来交。

贝卡:所以现在最新款的监控摄像头,都有人脸检测功能,发现画面中有人脸的时候,才截图传回服务器,非常节省带宽。至于网费,当然是中国老百姓交。

舒克:不过就算拍到我的脸,把我的脸跟几亿人的身份证照片对比,也要花很长时间吧。

贝卡:这个过程叫做人脸搜索。人脸搜索并不是直接比较照片,而是先让人工智能把每一张照片中人的面部特征提取出来,浓缩成一串数字。然后只要比较这串数字,就知道你的脸跟数据库中哪张照片最像了。通过这种方法,普通家用计算机一秒钟就可以把你的脸跟几千万张照片作比较。

舒克:这对普通人也太不公平了。

贝卡:没办法,知识就是力量。

舒克:如果要防止被人脸识别,就要减少脸上的细节,对不对?

贝卡:对,比如说戴口罩和墨镜就是一个很有效的方法。只要你的朋友认不出来,基本上人工智能也就认不出来了。但是香港政府最近就搞了一个禁蒙面法,将来大陆为了防止大家闹事,肯定也会搞一个这样的法律。


(以下是第二次补充。要提问的网友直接回复提问即可,我会稍后解答。)

舒克:你刚才提到香港政府。我听说香港法律对于监控技术的限制还是比较严格的,比如说摄像头如果拍到其他人家的窗户是违法的,警察要调取私人监控的录像要获得法院批准。

贝卡:是的,香港是讲法治的。

舒克:所以香港警察没法用大规模监控抓捕香港示威者咯?

贝卡:这个问题比较复杂。香港新闻媒体很自由,所以政府如果在街边安装带有人脸识别功能的监控摄像头,肯定是要犯众怒的。

因此香港警察主要是现场拍摄,你在新闻里也看到了,他们执行任务的时候一般都会带摄像机,目的就是为了保留证据,便于未来起诉。不管怎样,示威者一定要蒙面,最大限度地保护好自己。

舒克:但是中国有很多年轻人,他们说蒙面证明香港的示威者胆小如鼠,不敢光明正大发表自己的观点。

贝卡:蒙面是为了匿名。中国的人大代表选举,投票也是匿名的,难道证明中国人胆小如鼠?

舒克:我觉得“胆小如鼠”这个成语是对我们老鼠的一种侮辱。

贝卡:尤其是从中国人嘴里说出来的时候。

舒克:我记得2014年占领中环的时候,很多香港人是没有蒙面的,他们不担心被人脸识别。如果在大陆这么闹,肯定会被拉清单吧。

贝卡:2014年的时候,深圳公安和国安在香港街头进行了大规模的录像、抓拍。因为深圳公安不归香港政府、香港法律管,所以活动的自由度比香港警察更大。

舒克:那2019年呢?

贝卡:录像和抓拍是肯定的,但是因为示威者蒙面比例非常高,所以除非被现场拘捕或者查身份证或者跟踪到家,不太容易被秋后算账。

舒克:要是1989年的学生也蒙面就好了。

贝卡:是的,自由比诺贝尔和平奖值钱。

菜单