xyz
@xyz
xyz
@xyz
备份:https://t.me/s/pincongessence; https://nei.st
关注的小组(3)
动态 帖子 6 评论 240 短评 0 收到的赞 1 送出的赞 0
  1. xyz   在小组 2047 发表文章

    吐槽一下frozen 2

    六年前看forzen的时候非常喜欢,终于有一个没有王子救公主的disney电影了!讲好了一个能力强大但内心敏感脆弱的姐姐,和一个没有特殊能力但是内心强大的妹妹的情亲故事。再加上open the gate的二重唱以及let it go的洗脑,我非常喜欢,非常期待forzen 2。

    所以周末去看了forzen 2。没有特别惊艳,不像第一部环环相扣,讲了一个好的情亲故事。这次第二部得故事好像不是那么突出,唱唱跳跳一会就没有了,除了那个一直贯穿电影的OH~OH~ AH~AH~,皇后的all is found,以及elsa的独唱show yourself (恩,好像这首歌有些节奏和let it go中的有点像,不知是不是我的错觉...)以外,看完电影以后什么都没有记住...

    还有一下是吐槽一下主要人物画得第一部比起来好像一下大了10多岁,而且电影的色彩有点黑暗系,不是那么绚烂多姿...

    恩,最后是惊喜:Elsa的各种服装太让人流口水了...

  2. xyz   在小组 2049BBS 发表文章

    转贴一篇驳斥郑文杰“嫖娼论”的贴文

    下午逛华人的时候看到的,转贴一篇驳斥“嫖娼论”的贴文,我也没找到原帖的出处...

    https://m.huaren.us/showtopic.html?topicid=2474828

    另外,我不是这个贴的贴主,但是我同意贴主的一句话"墙内人关注有没有嫖娼,墙外人关注的是刑讯逼供,完全鸡同鸭讲"。

    后面大量无脑的五毛回帖忽略就好...

  3. xyz   在小组 2049BBS 发表文章

    Google使用算法技术以外的手段人工干预排序。

    昨天WSJ的头条大字报,占了周六Exchange栏目的三页纸,好不容易读完了,分享一下我自己的摘要:

    网络版本: https://www.wsj.com/articles/how-google-interferes-with-its-search-algorithms-and-changes-your-results-11573823753


    Google用了编辑的方法改变用户的搜索排序

    • 靠“人工”智能(真正的私人contractors)选择他们喜好的排序,以此为标准更新搜索(Zack Langley of Lionbridge Technologies Inc.的表述;“Mr. Langley was given hundreds of real search results and told to use his judgment to rate them according to quality, reputation and usefulness, among other factors.”; “Mr. Langley said it seemed like Google wanted him to change content on search so Google would have what he called plausible deniability about making those decisions. He said contractors would get notes from Lionbridge that he believed came from Google telling them the “correct” results on other searches.”)
    • 靠内部的“go/bad reporting system”人工干预算法排序(“how do vaccines cause autism”的例子)
    • 有一些网站在blacklists中 ("The Gateway Pundit" & "The United West");有一些网站被人工提高或减低排序(abortion的例子;conservative的网站和blog) ("Google’s shifting policies on interference—and its lack of transparency about them—inevitably force employees to become arbiters of what is acceptable, a dilemma that opens the door to charges of bias or favoritism.")
    • 政府 2016年以后要求了大量的人工干预移除一些搜索结果 (“Nearly 78% of those removal requests have been since the beginning of 2016”)
    • Google不再强调free expression (“Google’s culture of publicly resisting demands to change results has diminished, current and former employees said.”)

    编辑的重灾区是“auto-complete feature”

    • 因该是人工删除了一些联想词 ("less inflammatory than those of the other engines")
    • 有人工制定的blacklists

    Google的人工编辑更偏好大公司

    • 这个其实有非常严重的anti-competitive的问题,以此为理由其实可以要求对google进行oversight或者拆分...(“engineers opted to tilt results to favor prominent businesses over smaller ones, based on the argument that customers were more likely to get what they wanted at larger outlets. ”)
    • 大客户会收到更多的信息帮助他们提高搜索排序 (“Some very big advertisers received direct advice on how to improve their organic search results, a perk not available to businesses with no contacts at Google”)
    • 对大公司的更新更快 (“Google updates its index of some sites such as Facebook and Amazon more frequently, a move that helps them appear more often in search results”)
    • 也可以打压大公司, 比如Ebay,让他们屈服 (“Google told the company it had made a decision to lower the ranking of a large number of eBay pages that were a big source of traffic.”)
    • 甚至可以不给理由地干掉小公司 (DealCatcher的例子)

    其他

    • Facebook做得更过分(“have taken a more aggressive approach, manually removing problem content and devising rules around what it defines as misinformation. ”)
    • 描述了怎么样可以提高google排序的方法(比如freshness,langurage,location,time staying,等等)
  4. xyz   在小组 2049BBS 发表文章

    天猫双11数据是假的吗?

    @Merlin 在某个回帖中推荐了一个新闻给我(不用去找那个帖子了,有毒的...)。

    新闻来源: 天猫双11数据是假的? https://xw.qq.com/cmsid/20191113A032DE00

    虽然我不是empiricist,但我用我还记得一点点的econometrics试试看能否证实或者证否这个新闻...

    首先双11是短期的数据,受到的扰动比较大,趋势比较难以发现,所以我试试看用aggregated天猫每年的GMV来作为双11的标杆:1. 看看aggregated 天猫GMV是不是也可以被3项式拟合;2. 双11和天猫的数据拟合曲线是不是相似。

    天猫双11
    20122175191
    20134410350
    20147634571
    201511501912
    2016146521207
    2017210861692

    双11的数据来源: https://xw.qq.com/cmsid/20191113A032DE00

    天猫的数据来源: https://www.zhihu.com/question/283956444/answer/439835660

    用3次项拟合,图用Excel画的出来。

    直接跳到结果:

    如果用天猫每年的GMV数据,3项式拟合R^2是0.9966;用双11的数据,3项式拟合R^2是0.9983。而且可以看出拟合曲线以及residual value的正反两张图都是相似的。从这个上面来说双11的数据增长和天猫GMV的增长是吻合的,如果天猫GMV数据没有假,那么双11的数据增长没有问题。

    其实双11的数据,或者说所有短期销量的数据,都是可以由商家操纵到达制定的目标的(比如通过推迟销售和预售这种手段)。所以不管阿里需要双11这一天的销量是polynomial还是exponential的增长都可以达到,但是如果需要操纵长期的数据(天猫GMV),那么就难很多。

    综上,如果天猫GMV的数据没有问题,我认为双11的数据也没有问题。

    以上。

  5. xyz   在小组 2047 发表文章

    单一机构如何使用tether来操纵推高Bitcoin 2017-2018 的价格

    一篇WSJ的报道,写的很直接 https://www.wsj.com/articles/large-bitcoin-player-manipulated-price-sharply-higher-study-says-11572863400

    具体的证据和分析在这篇paper中 https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3195066

    总结一下:

    1. 按理说一个Tether coin的发布,它的发行方Tether Ltd.必须要放$1在它的reserve中。所以Tether是一个很好的crypto 买卖的中介货币(“About 75% of all bitcoin trading is in exchange for tethers” by WSJ)。

    2. Tether Ltd. 并没有维持它的reserve (“tether was only 74% backed by reserves” by WSJ),所以可以生造tether coin (“The study’s conclusion was tether was being printed regardless of customer orders.” by WSJ)。

    3. 某个单一机构用大量滥发的tether尝试购买bitcoin,从而虚构bitcoin的需求,人为推高bitcoin的价格 (“One pattern was especially illustrative: The study looked at 95 nonconsecutive hours that comprised the largest percentage of tether dispersals. This showed a consistent pattern: In the three hours before those dispersals, the price of bitcoin was falling. Immediately after the dispersal, the price began rising. Those 95 hours accounted for 59% of bitcoin’s compounded returns between March 2017 and March 2018.” by WSJ)。

    谈谈影响吧。首先,这篇报道给了facebook的libra coin沉重的一击,举例说明了currency backed coin并不可靠,还是可能不顾asset而滥发。其次,这对整个crypto 社区是一个沉重的打击,说明coin的价值和价格是没有asset可以支持,但是可以被一个人或者少数几个人进行人为操控的,因此不是一个以value为中心的投资品。最后,crypto 社区将来会是腥风血雨,投机者会尝试复制这种操控手法,对新进入crypto尝试投资的人进行财富掠夺。

  6. xyz   在小组 2049BBS 发表文章

    弱弱地问一句,这个地方允许聊天,灌水,八卦吗?

    看到大家讨论得都很认真,长篇大论,引经据典,好像就我一个人一直在八卦聊天,有点不好意思。

    我上网只是为了娱乐和放松,写paper太苦闷了,需要把脑子从完全理性和逻辑中抽出来,娱乐一下,聊聊天。和现实中的人还是有时候有所保留,要注意形象嘀... 北美和国内的几个论坛都有脾气非常大的人开骂和恶心人... 再加上注册ID发言太麻烦了...

    2049蛮好,匿名,而且现在还没有太恶心的人,我可以有时候水水吗?先问一声主人比较好:)