把 NAS 变成私人档案馆:Paperless-ngx + Tailscale + 本地 AI 折腾记录

把 NAS 变成私人档案馆

最近 Tailscale 官方博客发了一篇 Paperless-ngx 的实操指南,读完之后我觉得这件事对于已经有一台 NAS 在跑的人来说,是非常值得折腾一下的。

先说 Paperless-ngx 是什么:一个开源的自托管文档管理系统。你把纸质文件扫描进去(或直接导入 PDF/邮件),它会自动做 OCR 识别文字,然后你可以搜索、打标签、分类。如果有装本地 AI 模型,还能自动帮你归类和标注。

这听起来像是个”电子化办公”的工具,但它真正发挥作用的地方是你的 NAS 或者一直开机的迷你主机。因为文档管理这件事,最有价值的一定是”随时能搜到”——而不是每次要找某张发票时才去开电脑。

三个部署级别,丰俭由人

Tailscale 那篇文章把部署方案分成了三个级别:

入门级(Minimal):树莓派或者一台偶尔开机的旧笔记本,通过手机或 Web 上传文档。适合刚想试试看的场景。

常驻级(Always-on):NAS、迷你 PC 等 24 小时开机的设备,配上网络”消费文件夹”和扫描仪。这是大多数 NAS 用户的合理选择。

全开级(Go time):家用服务器 + paperless-gpt 做增强 OCR + 各种自动化(邮件自动抓取、SFTP、n8n 工作流)。适合已经把 NAS 玩出花的人。

不管你选哪个级别,有一个原则是共通的:绝对不要把存着敏感文件的 Paperless 直接暴露在公网上。这里就是 Tailscale 发挥作用的地方。

为什么 Tailscale 是关键一环

Paperless 管理的是税单、医疗记录、银行对账单这类高度敏感的文件。把它直接端口映射出去,等于在身份盗窃的路口立了个牌子。Tailscale 的方案很简单:只在你的私有 mesh 网络内访问 Paperless,对外界完全不可见。

安装 Tailscale 后,Paperless 通过 100.x.y.z:5000 或配置 MagicDNS 后通过 paperless.your-tailnet.ts.net 访问。其他设备上跑 Tailscale 并加入同一网络即可——不需要配端口转发、不需要搞 SSL 证书。

Tailscale 的 ScaleTail 项目已经把 Paperless-ngx 打包好了带 Tailscale sidecar 的 Docker Compose 模板,基本可以一键拉起。再配上 Gotenberg(文件格式转换)和 Tika(文本提取),能覆盖绝大部分文件类型——Word、Excel、PPT、邮件 .eml 都能吃进去。

加上本地 AI:让 Ollama 帮你打标签

Paperless 本身的 OCR 只能提取文字,但分类和打标签还是得人工来。这时候 paperless-ai 这个项目就有用了。

它的工作原理:监控 Paperless 的新文档 → 读取 OCR 文字 → 调用本地 LLM 分析内容 → 自动生成标题、标签、分类。

模型可以用 Ollama(命令行/服务式)或 LM Studio(桌面 App)来跑。如果 Paperless 和 AI 跑在不同机器上(比如 NAS 跑 Paperless、Mac mini 跑 Ollama),通过 Tailscale 把两者连起来就行——模型服务器端口只对 Tailscale 接口开放,对外不可见。

Tailscale 的作者本人试用后说效果”有时惊艳,有时诡异”——AI 自动归类比人工快很多,但也会产生一些过于小众的标签,甚至对某些关键词产生”执念”。需要定期调优 prompt、纠正输出、或换模型。

paperless-ai 的维护者已经在做一个大重写,同时 Paperless-ngx 官方也计划做原生 AI 集成,paperless-ai 未来可能会被官方取代。另一个备选是 paperless-gpt,它除了文本分析还支持视觉 OCR,对水印、竖排文字等有更好的处理能力。

我的判断

对于有 NAS 的人,Paperless-ngx 是一个”部署成本不高、长期收益很明显”的项目:

  • Docker Compose 一把梭,配合 ScaleTail 模板,一个下午基本能搞定
  • AI 打标签是可选的,不装也能用,但装了就回不去
  • 真正难的不是部署,是养成扫描习惯——你得愿意把收到的纸质文件丢进扫描仪
  • 备份一定要做。文档都存在一个盘上,挂了就全没了。rclone 同步到云端、rsync 到另一台设备、甚至通过 Tailscale 发加密 ZFS stream 到朋友家,都是可行的方案

如果你刚好有台群晖/Unraid NAS 和 Tailscale 已经在跑,这个周末不妨试试。毕竟找一张两年前的发票比在抽屉里翻半小时要愉快得多。


来源:Tailscale Blog (2026-04-28)

发表评论