在读这篇文章之前,你需要先了解一些人脸识别的背景知识。我早前曾经写过这些内容:https://2047.name/t/10028
当时记得在葱上有记者约稿,不过由于covid,那个记者的工作重心转为报道疫情了。
国内做人脸识别这行的头部企业是商汤、旷视、依图、云从,以及一系列下游寄生虫。寄生虫的意思是有些企业不做技术研发,而是把别人做好的技术包装成产品来卖。比如你在国内机场用的人脸识别,这些人脸识别应用往往不是技术最好的公司做的(所以识别率经常闹笑话),而是跟航空口的实权人士有勾兑的各种寄生虫公司用开源技术拼凑出来的。
人脸识别技术是AI技术的一个分支,由于AI研究非常开放(大家非常热衷于发布研究成果),所以人脸识别技术也继承了这个特点。头部企业和学术界结合非常紧密,因为只有这样才能 1)不断地把学术界的最新成果投入应用 2)不断地从各top院校吸引人才。在arxiv上的很多AI相关研究成果,基本上半个月内就会被头部企业复现,人脸识别技术尤其是这样。而头部企业在技术上取得的突破,也会在短时间内发paper公诸于世。结果就是头部企业技术水平其实都差不多,赚不赚钱主要还是取决于业务能力,这一点上一段也提到了,渠道往往比技术赚钱。
我说这个的意思是,不管是在国内还是国外,人脸识别相关的技术是没有垄断和壁垒的,你能做的我也能做。
这段时间总是看到新闻说,某家中国企业做的人脸识别,可以识别维族人,以此证明这企业参与迫害维族人。
其实,和人脸搜索、人脸比对相比,对人脸的属性进行分类(比如按照性别、年龄和种族分类)是一个难度很低的操作,只要你有足够多标注数据,任何一个top2计算机毕业生都可以自学一个月AI然后训练出能用的分类器。
所以“识别维族人”这个功能,不仅中国所有头部AI企业能做,下游跟屁虫也能做,top2毕业生也能做。
想看例子的,旷视科技官网上有人脸识别demo,上传照片后可以得出好几个属性,包括性别年龄微笑程度。原来是有人种检测的,white black asian,后来可能是因为他们公司进了制裁名单,出于PR考虑拿掉了。
https://www.faceplusplus.com.cn/face-detection/

头部企业和毕业生的真正的区别是,前者数据更多,现在很多AI企业牛逼不是因为他们的AI牛逼,而是他们积累的数据量大,这是因为AI模型的威力跟喂给它的数据量是成正比的(参见GPT-3)。所以要训练一个识别维族人的AI,真正的困难在数据。需要大量维族人的图像数据。比如说街头的监控,或者身份证照片+户籍信息。这些都是公安机关提供的。只要有了这些数据,谁都可以做维族识别。这两天有新闻说华为做维族识别,其实就算华为不做,政府只要开口,随时有几十家愿意做。所以问题关键并不在具体的某个企业。
关键还是中国人内部得先形成共识。现在很多中国人对维族问题的态度就是:虽然使用的手段貌似有点强硬(实际上是非常强硬甚至残酷),但这是必要的、没办法的。共识是这个样子的话,制裁多少企业都没用。
荷兰取消了身份证上的性别,中国或许也应该取消身份证上的民族,比办职业技能培训中心便宜多了。