@达摩俱乐部
@达摩俱乐部
关注的小组(3)
动态 帖子 5 评论 38 短评 0 收到的赞 0 送出的赞 0
  1. 达摩俱乐部   在小组 2049BBS 发表文章

    各网站流量分析用户跟踪脚本使用情况统计

    这里是一些大家常用或关心的网站的流量分析用户跟踪脚本使用情况的统计(被uBlockOrigin封锁为标准),下载csv文件。其中uBlockOrigin采用默认的简单模式,具体封锁列表来源请见这里

    Note: 本页不含用户跟踪或流量分析脚本

    https://diymysite.github.io/analytics/#!pages/tracking_stats.md

  2. 达摩俱乐部   在小组 2049BBS 发表文章

    流量分析和用户隐私 -- 简介

    流量分析

    互联网行业常用Analytics来描述流量分析。流量分析的实现方式有多种:浏览器端、网页端、网络中、服务器端。

    浏览器端

    比如你的浏览器安装了某种流量分析插件,那么这个插件可能将你的所有浏览数据传到分析公司的数据库,常见的如 SimilarWeb. 如果你的浏览器装有流量分析插件,那么无论你是通过代理、VPN、Tor访问网络,你的真实IP地址、操作系统、浏览器指纹等信息都会被分析公司搜集。很明显浏览器端的流量分析危险等级最高,这也是为什么某些极权政府热衷于推广国产浏览器的原因。详见这里。

    Cookies

    网页端的流量分析通常是通过cookies和网页插件来实现的。Cookies是很多网站必不可少的元素,但凡要你登录操作的网站都需要cookies,它是网站分发给你的一个临时记号。

    打个比方,你晚上去夜店一条街玩,每家夜店都会在你手臂上盖一个他们特有的图案,这样你出去吃完烧烤或打个电话回来,门口保安检查你有这个章就可以直接让你进去,而不是让你重新买票。但网站不会像夜店那样给每个人盖同样的章,而是会给每个用户一个唯一的临时号码,这样网站不但知道你什么时候来的,还知道你是你而不是同时登录网站的张三或李四。

    Cookies有什么危险呢?想象一下你在夜店一条街从9点玩到6点,回家刚好撞见你老爸出门晨练,你刚打算拿出事先练得滚挂烂熟的瞎话说自己昨晚同学聚会喝醉了住远近闻名的老实人刘帅家,结果你老爸二话不说一把拉起你的袖子,露出手臂上十多家不同夜店的章…… 所以,为了防止发生这种隐私泄露的尴尬,你得用一个关闭窗口就自动删除所有cookies的浏览器,你爸拉起你袖子的时候只能看到白白的手臂。

    夜店章时间久了会自动消失,cookies同样会有长短不同的有效期,某些cookies能保存很长时间这样你每次打开这个网站都不需要再输入一次帐号密码,方便,但问题是隐私。而某些网站则给cookies设置了一个寿命,过期就不认了,就像夜店章一样,否则你买一次票就能天天免费去玩,夜店老板不亏死了?

    网页插件

    有很多网站不需要使用Cookies,比如你现在正在看的这种根本不需要登录的静态页面。但网站是怎样知道自己的客流量多大,包括详细到具体内容的流量呢?通常有网页插件和服务器端两种方法。

    网页插件可以是javascript或者图片。网站使用网页插件来分析流量的原因无外乎以下两点:

    1. 方便 网页插件好用啊,比如Google Analytics能直接提供各种分析数据、图标,安装也比自己在服务器端安装分析软件方便多少倍。
    2. 权威 你自己服务器上的流量分析只有你自己知道,遇到那种吹牛逼的人怎么办?明明浏览量只有1000它说是一百万,而第三方插件则可以在必要时,比如面对投资人或广告投放商直接展示出你的Google Analytics。
    3. 不是自己的服务器 现在很多网站都可以不用自己的服务器就能搭建,比如你现在正在看这个就是托管在Github Pages上的。这种情况Github知道我的流量,但我自己不知道,所以我只能装网页插件来分析流量了。

    网页插件很容易识别,你只需要在网页上点击鼠标右键,查看网页代码,就能看到插件了。好吧你不会读代码,当我没说。不过市面上有很多浏览器插件专门检测或屏蔽网页插件,常见的广告屏蔽器(Ad Blocker)或脚本屏蔽器 no script, 或者跟踪插件屏蔽器 uBlock Origin,都可以告诉你哪些插件有问题,或者直接帮你屏蔽掉它们。这样,你对于流量分析来说就是隐形的了。噢~耶~

    服务器端

    你打开一个网站的过程大致如下:

    1. 你的浏览器要先问DNS服务器你输入这个网址的服务器在哪里,DNS服务器告诉你的浏览器一个IP地址。
    2. 然后你的浏览器就向那个IP地址的服务器发出请求,那个服务器在收到你的请求之后把网页文件传送给你的浏览器。
    3. 你的浏览器把接收到的网页文件 渲染 成你看到的漂亮网页。

    好吧,上述过程有点长,不过你反复读两遍就会发现这个过程有两个“服务器”知道你访问过这个网站的事儿。假如你访问的是pornhub,那么DNS服务器知道你曾经问过pornhub的网址在哪里,虽然你只是问了它pornhub怎么走,不代表你一定就去了pornhub,但,呵呵,come on,大家都知道问pornhub怎么走的人里头有99.99%都去了。第二个知道你访问过pornhub的当然就是pornhub自己啦,你向它要了网页呢,那还能赖掉?

    不过,你对pornhub很信任,因为你知道pornhub绝对不会出卖你,否则这事儿传出去以后谁还敢去它那儿?DNS服务器就没办法了。

    你是不是在想“我这次知道pornhub怎么走了,下次再去的时候就不用问DNS服务器了,这样DNS服务器就不知道我看过多少”。这个理论上是可以的,不过因为各种原因并不现实。像pornhub这种人民群众喜闻乐见的网站,至少有成千上万台服务器,你第一次去的地方,第二次去的时候可能正在服务别人,会拒绝你,所以pornhub每次都会让它的某个保安给你找一个空的卡坐。所以一般来说,你还得每次都问DNS服务器pornhub怎么走。

    服务器端的流量分析是无法避免的,服务器知道你在这里干的一切,如果你每次都换IP且不登录的话还好,服务器认不出你是同一个人,但如果你登录帐号的话……

    网络中

    互联网是一张网,前面描述的打开过程只是在应用层面,看上去只有DNS服务器和网站服务器(Pornhub)知道这事儿。实际上在更底层的网络,你发送的和接收到的每一个数据包都是经过很多服务器层层接力转发,就像你在淘宝剁手之后包裹是由网店老板交给快递收件员,途经收件站,经货车转运到机场或火车站,经铁路或航空送到你的城市总站,再经两三次转发送到快递门店,再由快递小哥送到你(或者小区门卫大爷)的手上。这中间很多人都可能打开你的包裹偷看一下你买了个啥好东西,这中间的每个环节都可能记录下你买了多少东西,比如快递门店一查这个月给你发了多少条短信就能统计你这个流量了。

    所以,网络中除了DNS服务器能做流量分析外,还有很多环节可能做流量分析。顺便说一句,看到这里,你大概明白防火长城是怎么封锁你的吧?一种方法是像机场安检,一扫你的包裹里有把枪或者一个炸弹,直接就拦下来了。第二种方法,看到你的发件地址是不允许的地方(比如收件人:台湾总统府)直接拦下,第三种也是最廉价的方法就是当你问DNS服务器pronhub怎么走的时候直接告诉你一个错误的地址(DNS污染)

    好啦,回到正题,除了DNS方的分析,你的ISP服务商(就是每个月收你网费的公司,或者给你网用的组织)通常会分析你访问了哪些网站,因为你所有的流量都会经过它控制的服务器。

    用户隐私

    流量分析会获取哪些用户隐私?(待续)

    来源:https: //diymysite.github.io/analytics/

    首页没有脚本,但仍然建议通过以下网页代理访问

    https://us.hideproxy.me/go.php?u=dPKLm2HsS4TmpPqtcMBOjs88pVYCYQy29pOB4vbBc6aEeg%3D%3D&b=5&f=norefer#!index.md

  3. 达摩俱乐部   在小组 2049BBS 发表文章

    征集一期以Ethics为主题的文章、书籍、教程和吐嘈

    因为被批评优越感联想到一个我自己觉得有意思的话题 Ethics

    Ethics很多时候被翻译为道德,但很明显是错误的,Ethics更像是守则、原则、职业道德。

    职业道德和道德差异很大很大,如果你在西方国家学法律、金融、管理以及一些社会学学科,你就知道职业道德绝对不是简单的「道德」,Ethics 绝对不是简单的非黑即白,或者分出好人坏人。事实上很多行业的Ethics非常详细,厚厚一本书,而这些Ethics很多时候并不符合传统道德。

    比如,你在从事盈利性事业的时候,既要保护雇主的商业机密又要向利益攸关的客户拥有足够的知情权。比如Google需要告诉用户哪些是广告,哪些是搜索引擎算法排序的结果。很多时候这是矛盾的,很难拿捏。

    很明显,百度这种公司心中完全没有这类Ethics,所以它可以毫无顾忌的付费排名,把广告和搜索结果混在一起。华为也没有什么Ethics,否则就不会出现251事件、狼性文化之类的东西。

    但要把Ethics弄好,还真不是有良心就能做到,特别是要在盈利或者追逐既定目标(比如影响力)的前提下兼顾Ethics真的很难拿捏。

    欢迎大家推荐资料、撰文、吐嘈

  4. 达摩俱乐部   在小组 2049BBS 发表文章

    哪些知识有利于促进社会改变?你对达摩俱乐部有什么想吐嘈?

    你觉得哪些知识被广泛传播最有利于社会进步~~颜色革命~~ 壮大公民社会?

    我知道

    • 党国大力禁止的:社会学、人类学
    • 党国大力封杀的

    想听听大家的想法,最好具体一点。另外欢迎对达摩俱乐部吐嘈。

    懦夫斯基同志说我

    不知道哪儿来的优越感和莫明其妙的偏见功利主义

    我暂且在蒙古里,大概因为这句话?

    我觉得比较理想的状态是半开放群组,内部先充分交流分享,讨论得比较成熟之后再由民主方式投票决定向公众发布部分成果,这样既增加公共福利,也为小圈子自身保留一些时效性和知识上的优势。保留这些优势对付出者更公平一些,毕竟知识这种东西利用得好可以帮你消灾避难,搞得不好也可以为他人作嫁衣。

    首先吧,这只是一个如何把事情做好的构想,其次如果批评能带上“我认为这样做更好”就能让讨论更有建设性了,不要什么都带上价值判断。

    达摩俱乐部上线一个多月了,感谢 TerminusBot 和 chinatimeline 帮忙改进代码,添加了很多实用的功能。

    最开始打算用 https://hackmd.io 不过好像并没有人用,我选这个集体编辑工具只是为了方便编辑协作,没考虑其他因素,如果你对hackmd有看法也欢迎评论。

  5. 达摩俱乐部   在小组 2049BBS 发表文章

    达摩俱乐部

    https://damoresclub.github.io/about/ @逻辑思维 拼拼凑凑大概是这个意思