文章
技术

【备份之法汇总帖】请列出你推荐使用的网页备份工具

唔...还是觉得这些工具略分散,专门开帖收集(征集)。请各位看官列出你推荐使用的网页备份工具。

基本前提:自己在使用且认为值得推荐的工具。

描述格式:

  • 工具名称:
  • 工具类型:插件名称(附链接更好)、网站平台、bot、小程序、......
  • 适用平台(浏览器/系统):Firefox、Chrome ; Android、iOS......
  • 备份保存格式:图片、PDF、HTML、新网页链接......
  • 分享方式:可从引擎检索到、需要手动打开分享传播
  • 工具是否需要翻墙:Y/N
  • 推荐理由:

PS:直接复制这个格式,再修改具体的描述。


抛砖:

  • 工具名称:Archive2049Bot(https://t.me/Archive2049Bot)
  • 工具类型:telegram bot
  • 适用平台(浏览器/系统):Telegram App
  • 备份保存格式:新网页链接
  • 分享方式:可从引擎检索到
  • 工具是否需要翻墙:Y
  • 推荐理由:方便移动端使用,自动返回备份结果,可检索
菜单
  1. 小二   默认开启批量屏蔽受限用户发言功能,可在设置中手动取消。

    底层存储

    • 网络存储
      • archive.today 保存最完整,抗打击能力最强
      • archive.org 遵守 robots 规范,抓取能力有限,无法处理图片懒加载的问题,无法保存微信公号文章图片
      • telegra.ph 配合这个Bot,够用快捷,只是图片仍然在原服务器,一般情况下问题不大。
      • ipfs 以matters为代表,抗封锁能力强,但需要人做种(pin),适合热门文章,不适合长期保存。
    • 本地保存/自建服务
      • monolith 多个工具的底层存储引擎

    工具库

    • archivenow 非常好用的一个 python 库,一句命令自动保存到多个网络存档服务,同时还有web接口,非常适合做机器人。

    保存工具

    直接面向用户(待补充)

    • 浏览器插件
    • 命令行工具
    • 机器人
  2. coronavirusnews  
    • 浏览器插件 + 命令行工具 SingleFile

    save a faithful copy of a complete web page as a single HTML file

    https://github.com/gildas-lormeau/SingleFile

  3. 懦夫斯基  

    也许可以添加一个描述:是否Tor友好。

  4. 无名  
    • 工具名称:Archiveror
    • 浏览器插件,适用 Chrome、Firefox(桌面、移动)
    • 集成 Archive.today 和 archive.org
    • 可保存为本地 html 文件
    • 是否需要翻墙:Y
    • 使用方法:https://free.com.tw/archiveror