@hello_chris
@hello_chris
关注的小组(2)
动态 帖子 3 评论 23 短评 0 收到的赞 0 送出的赞 0
  1. hello_chris   在小组 2049BBS 回复文章

    征集antispam方案

    接 Google 验证码吧,等忙过这段时间了,我可以看看怎么接入。

  2. hello_chris   在小组 2049BBS 回复文章

    说TG独裁还能理解,但为什么说他是纳粹呢?

    Google “中共纳粹” “中共 香港运动 镇压” “中共 新疆 集中营”

  3. hello_chris   在小组 2049BBS 回复文章

    Google 发布新的图书搜索方式,NLP 技术

    https://books.google.com/talktobooks/query?q=%E4%B9%A0%E8%BF%91%E5%B9%B3

    也不过如此

  4. hello_chris   在小组 2049BBS 发表文章

    请问群主有把腾讯大家的微信文章备份么

    如题,突然全部被屏蔽

  5. hello_chris   在小组 2049BBS 回复文章

    分享中文播客节目

    @小二 #6 播客中提过是研究生毕业,这学历还不高? https://lmzdx.com/archives/1887 "按照现在的话来说(20来年前我读的大学,还没现在这么分类,我们只分一批和二批),我读本科的学校是211,我读研究生的学校是top 2(感觉这个叫法很二…)"

  6. hello_chris   在小组 2049BBS 回复文章

    【help-wanted】端点星项目需要支援

    即使是文件存储服务,可以考虑把 GitHub 的 API 封装成 OSS ,单个 repo 有 100 G 的硬顶,外加众多的第三方 CDN 对其全球加速,对于大部分场景足够了。

  7. hello_chris   在小组 2049BBS 回复文章

    【help-wanted】端点星项目需要支援

    https://images.weserv.nl/ 可以考虑用这家的服务,利用 cloudflare 全球的 cdn 网络,同时可以 bypass 某些图片禁止外链的限制。不知道你要提取的是哪种元信息,任何语言请求链接,获取回来抓 meta 或者正文,都没有什么难度吧。

  8. hello_chris   在小组 2049BBS 回复文章

    端点星存档机器人-寻求 python web 开发

    这样的一个页面很简单,用 vuejs 写个前端,外加 Python 提供后端 api,当然如果后端逻辑已经实现,可以把 api 的规范公开下,好写前端。

  9. hello_chris   在小组 2049BBS 回复文章

    【help-wanted】端点星项目需要支援

    这个工具并没有什么特别,核心采用的是 https://github.com/postlight/mercury-parser ,通过 koa 这个 nodejs 框架封装成 json api 即可。

  10. hello_chris   在小组 2049BBS 回复文章

    端点星存档机器人-寻求 python web 开发

    我可以,有详细的接口文档么?

  11. hello_chris   在小组 2049BBS 回复文章

    我的Telegram Bot上线了 欢迎大家测试

    居然不需要任何审核直接上线。。。

  12. hello_chris   在小组 2049BBS 发表文章

    建议开辟一个板块专门号召大家收集整理这次武汉肺炎相关被删除的报道等

    虽然由 Github 这一个可以协作的平台,但因为其为程序员设计,导致交互体验让非程序员望而却步。提高了协作参与的门槛,但 2049 作为一个社区,除了不能上传附件外,交互较为顺畅。

    若能开辟一个板块号召大家收集整理资料,记录下这次事件中哪怕非常弱小的声音,也是非常有意义的一件事。

    另外,本人一直在做的项目,将页面生成 markdown 文档,通过 github api 及 gohugo 等静态页面生成器将网页备存保存,可参照“品葱精选”,https://github.com/Project-Gutenberg/Pincong https://project-gutenberg.github.io/Pincong/ 备份内容的同时,让墙内用户也可顺利访问。

  13. hello_chris   在小组 2049BBS 回复文章

    【help-wanted】端点星项目需要支援

    我在写一个把微信公众号的文章转为 markdown 的应用,这样便可以通过 telegram bot 之类的服务添加文章,参考 https://github.com/Project-Gutenberg/Pincong

  14. hello_chris   在小组 2049BBS 回复文章

    折叠功能和回帖不顶帖用户组已上线

    能把 bolt 替换成关系型数据库将会让开发方便很多,现在这与 bolt 相关的代码看起来头大

  15. hello_chris   在小组 2049BBS 回复文章

    有没有什么 “问答式” 的网站,禁得住 CCP 网络攻击的?

    @小二 要加一个锁帖功能,时间超过若干月,则不能回复。

  16. hello_chris   在小组 2049BBS 回复文章

    Our World in Data网站

    网站不错,但是很多数据多是十几年前的,时效性较低,经济民生相关的还是 https://www.ceicdata.com/ 这类商业数据库更新及时完整且全面。

  17. hello_chris   在小组 2049BBS 回复文章

    nei.st支持rss订阅么?

    不支持,网上有些工具支持自定义

  18. hello_chris   在小组 2049BBS 回复文章

    本人开发的全站爬虫\网站备份工具

    @新闻实验室 #5 提供的内容非常不错,不过本人时间和精力有限很难兼顾多个方向。

    你提到的 Spinkcat 在 Reddit 的留言有了解,但是这部分内容属于个人创作,需要向对方申请版权。

    本人项目中的 1 内容虽然是由海外学者整理出版,在某些学校图书馆可以公开查阅,但本人认为其设计的事件对中国影响非常之大,且若干在线资源被 GFW 认证,大陆若想了解相关的资源颇有难度,因此花时间整理。

    对于本人整理的 2,3 同理,目前更着重于科学研究价值较大、国内被和谐或在国内不易访问的内容。

    当然,对于你提到的一些内容和方向,本人愿意提供技术支持,一起协作完成。

    另:你提到的 reddit 连接 可以点 load it anyway 或其他两个选项均可以查看,如若不可还可以把项目 clone 到本地查看。

  19. hello_chris   在小组 2049BBS 发表文章

    本人开发的全站爬虫\网站备份工具

    本项目的缘起是由于查询 文化大革命时期 中使用到的大字报及官方通告等宣传物料,于是通过 Google 发现 https://ccradb.appspot.com/ 和 无产阶级图书馆 分别提供全文阅览及光盘版下载,但考虑到第一个站 appspot 已被 GFW 认证,而第二个站则需要 Windows 操作系统(本人Macos),使用和查询并不方便,于是想到了将其全站下载并开放在 Github 方便其他人查询使用。

    因此诞生了本项目,如果熟悉 Python 和 Scrapy,写一个爬虫,只需要十几行代码,耗时半小时到若干小时不等,再配合 Gohugo 等静态网站生成器,可以很方便的利用 Github Pages 生成一个全新的没有被 GFW 认证的网站。

    https://github.com/speechfree/wholesite-crawler

    通过此工具爬取的整站目前有如下几个:

    1. ccradb 中国文化大革命文库 https://speechfree.github.io/cultural-revolution-database/
    2. xys 新语丝 https://speechfree.github.io/xys/
    3. letscorp 墙外楼 https://speechfree.github.io/letscorp/

    欢迎各位添加新的爬虫

  20. hello_chris   在小组 2049BBS 回复文章

    找到了一个很像原墙外楼的文章收录网站

    好奇这个站是如何做出来的,看到几篇 nationalgeographic 的文章,除了几乎把原网站的样式搬了过来,还十分认真的全部汉化了!

  21. hello_chris   在小组 2049BBS 回复文章

    打算创建一个「公民学会」,想听听大家的想法?

    哈!https://civicforum.github.io/ https://damoresclub.github.io/about/ 两个站也是楼主做的么?很不错!

  22. hello_chris   在小组 2049BBS 回复文章

    打算创建一个「公民学会」,想听听大家的想法?

    推荐内容链接 + 140字左右推荐理由 + 若干 tag,这种形式可以考虑先在这个站外加 twitter 做起来。最后做成周报发布到 github + pages。

  23. hello_chris   在小组 2049BBS 回复文章

    打算创建一个「公民学会」,想听听大家的想法?

    @懦夫斯基 #10 Git Pages 之所以流行是可以不需要购买服务器即可搭建一个博客,相比于常见的 需要服务器的 bbs 或者博客运行成本要低很多,但其 Page 适合静态内容展示,而非动态交互。当然有一些 cms 利用 github 做后端,可以实现一定程度的交互,但可用性还是要差一些。

    国内归于 Github Pages 的屏蔽目前仅仅是在 DNS 层面将其 IP 解析到一个不可用 IP,面对这个问题,换成 Google 或 Cloudflare 这类 DNS 服务器就能很好解决。

    此外,基于 Github 其内容更加容易被复制,也更不易于被消失。

  24. hello_chris   在小组 2049BBS 回复文章

    致站长: 勿步V2EX后尘

    @小二 #2 可以考虑把需要新增的功能或Bug 列出来,有时间的可以参与进来。本人有时间和兴趣参与。