谈维族人脸识别

rebecca · 2021年1月14日我不是品葱的神，但是后来发生了一些事情

在读这篇文章之前，你需要先了解一些人脸识别的背景知识。我早前曾经写过这些内容：https://2047.name/t/10028

当时记得在葱上有记者约稿，不过由于covid，那个记者的工作重心转为报道疫情了。

国内做人脸识别这行的头部企业是商汤、旷视、依图、云从，以及一系列下游寄生虫。寄生虫的意思是有些企业不做技术研发，而是把别人做好的技术包装成产品来卖。比如你在国内机场用的人脸识别，这些人脸识别应用往往不是技术最好的公司做的（所以识别率经常闹笑话），而是跟航空口的实权人士有勾兑的各种寄生虫公司用开源技术拼凑出来的。

人脸识别技术是AI技术的一个分支，由于AI研究非常开放（大家非常热衷于发布研究成果），所以人脸识别技术也继承了这个特点。头部企业和学术界结合非常紧密，因为只有这样才能 1）不断地把学术界的最新成果投入应用 2）不断地从各top院校吸引人才。在arxiv上的很多AI相关研究成果，基本上半个月内就会被头部企业复现，人脸识别技术尤其是这样。而头部企业在技术上取得的突破，也会在短时间内发paper公诸于世。结果就是头部企业技术水平其实都差不多，赚不赚钱主要还是取决于业务能力，这一点上一段也提到了，渠道往往比技术赚钱。

我说这个的意思是，不管是在国内还是国外，人脸识别相关的技术是没有垄断和壁垒的，你能做的我也能做。

这段时间总是看到新闻说，某家中国企业做的人脸识别，可以识别维族人，以此证明这企业参与迫害维族人。

其实，和人脸搜索、人脸比对相比，对人脸的属性进行分类（比如按照性别、年龄和种族分类）是一个难度很低的操作，只要你有足够多标注数据，任何一个top2计算机毕业生都可以自学一个月AI然后训练出能用的分类器。

所以“识别维族人”这个功能，不仅中国所有头部AI企业能做，下游跟屁虫也能做，top2毕业生也能做。

想看例子的，旷视科技官网上有人脸识别demo，上传照片后可以得出好几个属性，包括性别年龄微笑程度。原来是有人种检测的，white black asian，后来可能是因为他们公司进了制裁名单，出于PR考虑拿掉了。

https://www.faceplusplus.com.cn/face-detection/

头部企业和毕业生的真正的区别是，前者数据更多，现在很多AI企业牛逼不是因为他们的AI牛逼，而是他们积累的数据量大，这是因为AI模型的威力跟喂给它的数据量是成正比的（参见GPT-3）。所以要训练一个识别维族人的AI，真正的困难在数据。需要大量维族人的图像数据。比如说街头的监控，或者身份证照片+户籍信息。这些都是公安机关提供的。只要有了这些数据，谁都可以做维族识别。这两天有新闻说华为做维族识别，其实就算华为不做，政府只要开口，随时有几十家愿意做。所以问题关键并不在具体的某个企业。

关键还是中国人内部得先形成共识。现在很多中国人对维族问题的态度就是：虽然使用的手段貌似有点强硬（实际上是非常强硬甚至残酷），但这是必要的、没办法的。共识是这个样子的话，制裁多少企业都没用。

荷兰取消了身份证上的性别，中国或许也应该取消身份证上的民族，比办职业技能培训中心便宜多了。

筆下著史

刘仲敬 Historian | 《遠東的綫索》、《經與史》作者，刀下閱屍

内容已删除
内容已被作者本人或管理员删除。如有疑问，请点击菜单按钮，查看管理日志以了解原因。

2021年1月14日 /p/121846

菜单
耶渣

狼狼醬私信可以，但我保留你亂罵的時候公開私信的權利。不算好的基督徒，深信左右都是膠的港獨。

@刘仲敬 #121846 只不過是政府不再注意這些區別一視同仁而已，不是要消滅誰。

2021年1月14日 /p/121852

菜单
筆下著史

刘仲敬 Historian | 《遠東的綫索》、《經與史》作者，刀下閱屍

内容已删除
内容已被作者本人或管理员删除。如有疑问，请点击菜单按钮，查看管理日志以了解原因。

2021年1月14日 /p/121853

菜单
耶渣

狼狼醬私信可以，但我保留你亂罵的時候公開私信的權利。不算好的基督徒，深信左右都是膠的港獨。

@刘仲敬 #121853 如果要搞一個多民族國家，故意去區分民族成分除了會引起紛爭之外並無好處。維漢兩族之間的紛爭正是因為政策上差別對待引發的。

既然人天賦的權利和尊嚴都是平等的，他是甚麼民族的人對一個政府來說並不重要，因為他享有的權利和義務都和其他人一樣。

問題是維吾爾人的宗教自由受侵犯，問題是維漢之間差別對待，那政府取消這個政策上的傾斜和對全部人的宗教自由的限制不就成了嗎？

2021年1月14日 /p/121857

菜单
外逃贪官CA

邹韬奋虽然韬光养晦，亦当奋起而争(拜登永不为奴：h.2047.one)

@Wolfychan #121857 这是一个比较理想的状态。现实很骨感的。

2021年1月15日 /p/122046

菜单
耶渣

狼狼醬私信可以，但我保留你亂罵的時候公開私信的權利。不算好的基督徒，深信左右都是膠的港獨。

@消极 #122046 那是因為政府太勤力。只管收稅和國防，其他除了訴訟，啥都不管交給居民自治不香嗎？

是要搞那麼多事情。

2021年1月16日 /p/122083

菜单
外逃贪官CA

邹韬奋虽然韬光养晦，亦当奋起而争(拜登永不为奴：h.2047.one)

内容已删除
内容已被作者本人或管理员删除。如有疑问，请点击菜单按钮，查看管理日志以了解原因。

2021年1月16日 /p/122084

菜单
耶渣

狼狼醬私信可以，但我保留你亂罵的時候公開私信的權利。不算好的基督徒，深信左右都是膠的港獨。

内容已删除
内容已被作者本人或管理员删除。如有疑问，请点击菜单按钮，查看管理日志以了解原因。

2021年1月16日 /p/122086

菜单
外逃贪官CA

邹韬奋虽然韬光养晦，亦当奋起而争(拜登永不为奴：h.2047.one)

内容已删除
内容已被作者本人或管理员删除。如有疑问，请点击菜单按钮，查看管理日志以了解原因。

2021年1月16日 /p/122087

菜单
rebecca 我不是品葱的神，但是后来发生了一些事情

@Wolfychan #121857

既然人天賦的權利和尊嚴都是平等的，他是甚麼民族的人對一個政府來說並不重要，因為他享有的權利和義務都和其他人一樣。

然而现代国家基本上都是按照民族划分的。没有任何国家会说其他国家的国民和自己的国民是平等的。在中国的各民族之间也是这个问题。

这也许就是为什么去掉身份证上的民族，比去掉性别更困难。

补充：我主要是评论“既然人天賦的權利和尊嚴都是平等的，他是甚麼民族的人對一個政府來說並不重要”。

前提是【天赋人权】和【政府无民族性】，而这两个前提目前在世界范围内是不成立的。如果有一天这些前提成立了，那么民族国家这种政体也就失去了存在的必要，世界共享一个政府。

2021年1月16日 /p/122095

菜单
耶渣

狼狼醬私信可以，但我保留你亂罵的時候公開私信的權利。不算好的基督徒，深信左右都是膠的港獨。

@rebecca #122095 你把國民和民族搞混了。

2021年1月16日 /p/122098

菜单
shepherd
楼主说的满在点上的（虽然对于训练集合和效果成正比这点我不同意，不过整体来看说胜负取决于数据量应该没有大问题）。脸部识别技术说他是烂大街我觉得都一点不为过。目前主流的技术关键就两个重要因素
1. 大量的人工标注的数据
2. 高性能的硬件（GPU）
用廉价的人工获得大量的数据我觉得在国内是最好搞定的事情了，况且标注是否是维族人这种标注任务几乎可以说不是瞎子就能做。所以我感觉真要制裁还不如断供GPU。
2021年1月16日 /p/122099

菜单
外逃贪官CA

邹韬奋虽然韬光养晦，亦当奋起而争(拜登永不为奴：h.2047.one)

@shepherd #122099 很难制裁，美国高科技公司生产了大量的芯片要卖，顶多制裁要求是美国不能向中国直供，到时候韩日新加坡都来转运，再敲诈中国一笔比较理想。

2021年1月18日 /p/122329

菜单
外逃贪官CA

邹韬奋虽然韬光养晦，亦当奋起而争(拜登永不为奴：h.2047.one)

@rebecca #122095 去掉性别也是很难的事情。

2021年1月18日 /p/122330

菜单