GitHub:GitHub - paperless-ngx/paperless-ngx: A community-supported supercharged version of paperless: scan, index and archive all your physical documents
在线演示:https://demo.paperless-ngx.com
官网:https://docs.paperless-ngx.com
AI工具专区:+AI工具-喜好儿aigc
Paperless-ngx是一款开源的文档管理系统,能够将纸质文档转换为可搜索的在线档案,减少纸张使用。内置OCR功能,可自动执行OCR,识别文档中的文字并转换为可编辑和可搜索的文本格式,便于分类、索引和随时搜索查阅。
Paperless-ngx的主要功能:
- 组织和索引文档:通过标签、通信者、文档类型等关键信息,能够将文档进行有效的分类和索引。这使得用户可以轻松地找到他们需要的文档,提高了工作效率。
- 执行OCR:支持对文档执行OCR,即使是只有图像的文档也能被转化为可搜索和可选择的文本。这项功能为用户提供了更方便的检索体验。
- 支持多种语言:借助开源的Tesseract引擎,可以识别超过100种语言,确保用户在全球范围内都能够有效地管理多语言文档。
- 文档保存格式:文档以PDF/A格式保存,这种格式专为长期存储而设计,同时保留了未经修改的原始文件,确保文档的完整性和长期可访问性。
- 机器学习自动标记:利用机器学习技术,能自动为文档添加标签、通信者和文档类型,减轻用户手动标注的负担,提高标记的准确性。
- 支持多种文件类型:Paperless-ngx支持PDF文档、图像、纯文本文件、Office文档(Word、Excel、Powerpoint及LibreOffice等价物)等。
- 直观的Web应用:提供直观的Web应用,包含定制化仪表板、过滤器、批量编辑、拖放上传、定制化视图、自定义字段、共享公共链接等功能,以满足用户对个性化管理的需求。
- 支持全文搜索:系统支持全文搜索,包括自动完成、相关性排序、高亮显示匹配查询的文档部分等功能。用户可以使用关键词、标签或其他元数据进行搜索,使得查找所需信息变得更加简便。