文章
观点

存档机器人

@Ciao Archive2049Bot挺好用的。

除了archive.is,您可否为Wayback Machine (https://web.archive.org )开发一个存档机器人?

菜单
  1. 无名  

    「Internet Archive 抓取网页时遵循 Robots 协议 ,如果网站在 robots.txt 中声明禁止搜索引擎抓取,那么 Internet Archive 将拒绝存档该网站。所以对于微信公众号,无法用 Internet Archive 进行存档的。」 这篇介绍了这两种存档。https://blog.bgme.me/posts/how-to-archive-a-web-page/

  2. 小二   默认开启批量屏蔽受限用户发言功能,可在设置中手动取消。

    理论上可以选各种存档工具,包括你说的wayback,只需要修改 https://github.com/Terminus2049/ArchiveTeleBot/blob/d6de38f0f068c4897093bece2abf3f222e7b2235/ArchiveTeleBot.py#L16 后面的参数就行,把is改为ia就可以了。如果选择参数all,就会返回所有可能的存档机器人。

    你可以看文档:

    https://github.com/oduwsdl/archivenow

  3. Colinchao  

    @小二 #2 我既不是程序员,也没有VPS,恐怕本人无能为力。

  4. Colinchao  

    WTF? 站长,你改了名字后就有人抢注了你之前的名字。抢名字很有趣吗🤷🏻‍♂️……