可靠的信息
我突然想到,什么信息是可信的,如何增加可信的信息。我们了解的信息或者说知识,有几种途径。
- 亲自通过感官认识的。
- 别人告诉我的。
第一种知识大概是最可信的,其中最可靠的还要属「我思故我在」。第二类知识还要分许多类别,政府宣传的,朋友告诉我的,还是网络上的陌生人告诉我的,大的新闻媒体,社交网络的名人,学术论文,史书、教科书。但第一类的事实总是占比很小,很多时候要靠别人告诉我。除了感官直接获取的信息,其他的信息都是间接得到的。在本文的语境下,信息有且只有两种来源,亲自验证的,和间接得到的。这里的信息是对于客观世界感官的观测,即经验。我们用怀疑的眼光审视所有的信息,但在此着重考虑第二种信息。
我想,除了我亲眼见到的,朋友告诉我的最可信,因为他们没有欺骗我的动机。最不可靠的是历史资料,没有人能确定史书受了多少篡改,但伪造的部分可能不符合逻辑而被人发现。谎言总是存在,而人本身也有一定的判断信息真伪的能力。所以,既然我不能见证所有的事实,我希望这里的「他人」是没有恶意的,希望他们的声音不受抑制。
Reddit 对录像数据伪造曾经有探讨,ML 的发展已经大幅降低了伪造的成本(不出几年应该可以直接生成电影了)。数据本身恐怕不能成为证据了。我们用录像作为证据时,其实依靠了录像难以伪造的前提,所以录像的内容被认为是真实的。这意味着证据本身产生的可信度会越来越小,以后不得不相信证词和证人。而制造谎言的人,他们的谎言会越来越真实。
刚刚看到有人在争辩文革的是非,大概不会有结果吧。
互联网的意义在于,它让许多人成为了事实的记录者。史书往往是少数人写的。为什么不让所有人参与事实的记录呢,毕竟每个人都在社会中生活。增加真相,减少谎言,大概是件好事。假如非要增加谎言,那么这部分的谎言可能是被编造出来为少数人服务的,因此还是增加真相比较好。
用密码学获得可靠信息的尝试
还是要运用之前提出的区块链、密码学技术,我们首先登记公民的密码学身份到链上。这是在言论自由和新闻自由的基础上,再进一步。
如果我想知道新冠病毒疫苗的效果,可以发起一场匿名投票,投票者需要提供:
- 投票者自我反馈,打了什么疫苗,这个疫苗的效果如何,有什么副作用(这里会尽量避免常人认知水平造成的误差)
- 疫苗公司可以在打疫苗后向参与者提供密码学证明。在投票中可以匿名提供,为自我反馈增加证据。
- 密码学证明,它可以证明:投票者是公民的一员,并且没有重复投票,除此以外完全匿名。
这种问卷调查会准确的多,论文有统计的方法和结果,但没有统计的证明。投票结果可以每个人独立验证,只要承认登记的公民密码学身份,承认数学,就没有任何理由怀疑密码学证明的投票结果。这是最理想的方法。
还可以增加第三条投票的条件,要求投票者是我社交网络内「朋友的朋友」圈内的 256 人,这样会多一层直接或是间接的信任因素。
同样是调查问卷的形式,可以确定一些其他的命题,新开的饭馆是否好吃,或者,64 当日发生了什么。这些命题不需要专业能力,只需要基本的认知水平。
反观现在,这样的工具是不存在的,谷歌上有许多营销文章,其中最可信的只有论文了,社交网络只有初步的功能,网购平台有许多虚假评论。
可靠的专业知识 ?
譬如说最佳的 covid 治疗方法,这超出了本文的范围,因为它不属于本文意义上的信息,它是根据信息研究得出的结论。
PKI 产生之后
Publickey Infrastructure(大规模密码学身份的登记)产生之后,就不会有「编造的名言」了。
如果社交平台的每句话附有「数字签名」,或者 hash 被记录到链上,那么所有的言论都可以验证,任何篡改都会被立刻查出。
不必担心,仍然可以保有匿名,因为 publickey 不一定和实名身份绑定。这早已发生,如 PGP mailing list。
可靠的历史
Wayback machine 记录了许多网站,各种新闻,政府门户网站发布的资料,其中包括了北京政府如何清理低端人口,这部分后来被政府删除。
当证据逐渐失效的时候,
- 记录更难以伪造的真实数据。
- 构建、寻找一种区分证词可信度的方法,至少让编造谎言有巨大的成本。
从获取信息的角度考虑
上文提到的密码学元数据是一种信息自证的方法,它人为地构建了信息之间的联系。这是一种逻辑上的联系,于是我们可以用较少的前提确认较多的信息。譬如说如果某公钥属于某人,那么所有这个公钥签名的信息,大概率来源于此人;如果我们能预先确认文件的 hash,那么我们就能完全确认文件的内容;如果我们有区块链的 genesis block,那么我们就能共同承认一个不断演进的共识。
个体获取信息是一种持续的过程,亲自见证事实的无需验证,而间接得到的信息会通过其他的一切的可靠的我们所确信的事物验证。
可以预见一种情况,某些信息是和其他信息之间互相比对才得以判断真伪,那么审查者只需要压制一部分,宣扬另一部分,就有足够蛊惑的能力。如果这个信息是证据,那么操纵的方式就叫断章取义。
现代人的信息获取大多依赖互联网,而互联网又以搜索引擎、各大媒体、社交网络为主要的个人的信息来源。
- 因此,第三点是从个体的角度考量。尽量获取准确真实的认知(此次强调获取完善的信息),而这是高度依赖于工具的。
既然前文关注证据本身的属性,这里将目光投向别处。关注证据本身,意味着强调信息的本身特征。一篇文章的叙事可以用合理的逻辑自证它的可信度,同样,一封邮件可以用数字签名自证它的可信度,而数字签名基于数学,和逻辑一样都是先验的知识。有趣的是,这种可信度是由计算机验证的。
如果个体的信息分为两种,已知的和未知的,那么在挖掘分析完已知的信息,必然要获取未知的信息才能进一步修正自己的认知。对于前者,虽然还没有人工智能代替读者分析文章的逻辑,但密码学的验证是可以做到的。后者则依赖于互联网,将它作为一种获取信息的工具。
言论自由、新闻自由是基本的前提,我们还可以更进一步,譬如将私人的公司的平台纳入公共监管的范围,要求同等的自由;由政府推行民主的去中心化的互联网。
信息的 Algocracy
Algocracy(governance by algorithm)与官僚制相对,但在这我不指特定的制度,而是算法本身对社会的影响,这种影响大概不会小于「台面上的政治」,影响的程度再加深便是操纵。
它的影响显然,早已有人论述,互联网作为 Algocracy 的体现,影响了全球的经济政治。人获取信息依赖搜索引擎,当今的搜索引擎有向人工智能发展的趋势,人也依赖互联网的推荐系统,算法的重要性不断增加。
相比以人工智能作为一种信息获取的工具,实现本文的目标,眼下密码学更为直接有效,因此着重讨论。