PDFBox是一个非常好用的,开源的用于处理PDF文档的 Java工具,支持各种语言和平台的PDF工具和类库就如雨后春笋般涌现。PDFBox 提取文本,包括Unicode字符。PDFBox和Jakarta Lucene等文本搜索引擎的整合过程十分简单。加密/解密PDF文档。PDFBox从PDF和XFDF格式中导入或导出表单数据。向已有PDF文档中追加内容。将一个PDF文档切分为多个文档。感兴趣的朋友不要错过了。

功能介绍

1、文本提取:从PDF文档中提取文本。

2、合并&分割:可以把多个PDF文档合并成单个,也可以把单个PDF分拆成多个PDF文档。

3、表单填充:可以从PDF表单中提取数据,或者是填充PDF表单。

4、PDF/A验证:验证PDF文档是否满足PDF/A ISO标准。

5、PDF打印:把PDF文档输出到打印机——利用了Java的打印API。

6、PDF转换:可以把PDF文档转换成映像文件。

7、PDF创建:可以从头创建新的PDF文档。

8、集成Lucene搜索引擎:Lucene搜索引擎与PDF索引相集成。

更新日志

这个版本是基于 2.0.5 版本的增量式 bug 修复版本,包含了几个修复和小改进,更新如下:

Bug 修复

[PDFBOX-3313]-Java 9 InaccessibleObjectException

[PDFBOX-3318]-IllegalArgumentException in PDPageTree constructor: root cannot be null

[PDFBOX-3347]-COSName parsing doesn’t handle ISO-8859-1 encoded bytes

下载地址

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。