从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统

98 阅读3分钟

从“纸堆”到“电子化”文档:用这个开源系统打造你的智能文档管理系统

大家好,我是星哥。公司的项目文档存了一堆 PDF,想找某份去年的供应商协议,搜半天都没结果 ——“纸质乱、电子散”,简直是当代人的文档管理痛点。

今天就给大家推荐一款能彻底解决这个问题的开源工具 ——paperless-ngx,它能把你的纸质文档 “变” 成可搜索的线上档案,从此告别 “翻箱倒柜找文件” 的麻烦,还能自己掌控数据安全,关键是完全免费!

paperless-ngx 是什么?

首先得明确一点,paperless-ngx 不是凭空冒出来的 “新工具”—— 它是经典项目 Paperless、Paperless-ng 的官方继任者。原来的项目因为维护精力问题逐渐停滞,现在由一个团队接手迭代,不仅延续了核心功能,还修复了不少旧问题、加了新特性,稳定性和实用性都更上一层。

paperless-ngx 正是为了解决这个痛点而生的:

  • • 🧾 扫描归档:将纸质文件数字化,统一存储。
  • • 🔍 全文检索:内置 OCR(光学字符识别),支持快速搜索。
  • • 🗂 标签与分类:灵活的标签体系,让文件管理更直观。
  • • 🌍 多语言支持:社区驱动,持续更新,国际化完善。

一句话总结:它就是你的 私人文档 Google

开源地址:github.com/paperless-n…

img

安装部署

环境要求

Linux 系统或者支持Docker和Docker Compose的环境。

1.使用docker安装


    
    
    
  1.新建一个网络
docker network create paperless-net

2.生成一个redis
docker run -d --name redis --network paperless-net redis:7
3.镜像安装
docker run -d --name paperless-ng \
  -e PUID=1000 -e PGID=1000 \
  -e TZ=Asia/Shanghai \
  -e PAPERLESS_OCR_LANGUAGES=eng+deu \
  --network paperless-net \
  -e PAPERLESS_REDIS=redis://redis:6379 \
  -p 8000:8000 \
  -v /data/docker/paperless/data:/data \
  -v /data/docker/paperless/media:/media \
  ghcr.io/paperless-ngx/paperless-ngx:latest

2. Docker Compose(不建议)

网络环境的问题下载很慢

如果你是 Linux 系统(或 Docker 环境已装好的 Windows/macOS),直接在终端执行这条命令:

Docker Compose


    
    
    
  不要用root来运行

bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"

使用


    
    
    
  [root@node3 ~]bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 12089  100 12089    0     0  22681      0 --:--:-- --:--:-- --:--:-- 22681
Do not run this script as root.
[root@node3 ~]# su -l www
[www@node3 ~]$ bash -c "$(curl -L https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/install-paperless-ngx.sh)"
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 12089  100 12089    0     0   9749      0  0:00:01  0:00:01 --:--:--  9749

WARN: It look like the current user does not have Docker permissions.
WARN: Use 'sudo usermod -aG docker www' to assign Docker permissions to the user (may require restarting the shell).


#############################################
###   paperless-ngx docker installation   ###
#############################################

This script will download, configure and start paperless-ngx.

1. Application configuration
============================

The URL paperless will be available at. This is required if the
installation will be accessible via the web, otherwise can be left blank.
Examplehttps://paperless.example.com

最后卡在这一步了


    
    
    
  https://raw.githubusercontent.com/paperless-ngx/paperless-ngx/main/docker/compose/docker-compose.postgres.yml
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.109.133185.199.108.133185.199.111.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.109.133|:443... connected.
HTTP request sent, awaiting response... 

img

使用paperless-ngx

img

向导

img

上传文件

img

文档页面

img

文档预览

img

核心特性亮点

功能说明
OCR 识别自动识别扫描件文字,支持多语言。
全文搜索输入关键词即可秒级定位文档。
标签/元数据自定义标签、日期、类型,轻松分类。
Web 界面基于 Django + Angular,操作直观。
Docker 部署一行命令即可快速启动。
社区活跃3w+ Star,持续迭代,生态丰富。

适用场景

  • 个人用户:账单、合同、证件扫描件集中管理。
  • 小型团队:共享文档库,支持权限管理。
  • 企业内部:搭建私有化文档归档系统,避免敏感信息外泄。

⚠️ 注意:官方建议不要在不可信的公网主机上直接运行,因为默认存储未加密。最佳实践是 自建本地服务器 + 定期备份

总结

如果你正被纸质文件和扫描件困扰,paperless-ngx 是一个值得尝试的开源解决方案。它不仅能帮你实现“无纸化”,更能让文档管理进入 可搜索、可分类、可扩展 的新时代。