当您需要将表格中的数据从PDF导出到 Excel工作簿时,可能存在多种情况。PDF to Excel 允许您编辑数据、应用公式、绘制图表以及执行电子表格支持的其他操作。在本文中,我将向您展示如何使用 Java 以编程方式自动将 PDF 转换为 Excel并将 PDF 转换为 XLS 到 XLSX 工作簿。为此,我们将利用Aspsoe.PDF for Java API 的功能。
Java PDF to Excel Converter – 安装
Aspose.PDF for Java可作为 JAR 文件下载。此外,您可以使用以下配置将其安装在基于 Maven 的应用程序中。
存储库
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>https://repository.aspose.com/repo/</url>
</repository>
依赖
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-pdf</artifactId>
<version>20.5</version>
<classifier>jdk17</classifier>
</dependency>
使用 Java 将 PDF 转换为 Excel XLS
要将 PDF 转换为 Excel XLS,您只需加载 PDF 文档并使用.xls扩展名保存。以下是执行此转换的步骤。
- 使用Document类加载 PDF 文件。
- 使用Document.save(String outputFileName, int format)方法将 PDF 保存为 Excel XLS 。
以下代码示例展示了如何使用 Java 将 PDF 转换为 Excel XLS。
输入PDF文件
输出 Excel 电子表格
使用 Java 将 PDF 转换为 Excel XLSX
要将 PDF 转换为 XLSX 电子表格,您需要使用ExcelSaveOptions类定义输出 Excel 格式。以下是使用 Aspose.PDF for Java 执行 PDF 到 XLSX 转换的步骤。
- 使用Document类加载输入的 PDF 文档。
- 创建ExcelSaveOptions类的实例。
- 使用ExcelSaveOptions.setFormat(ExcelSaveOptions.ExcelFormat.XLSX)方法设置输出格式。
- 使用Document.save(String outputFileName, SaveOptions options)方法将 PDF 转换为 Excel 。
以下代码示例展示了如何使用 Java 将 PDF 转换为 XLSX。
尽量减少 PDF 到 Excel 中的工作表数量
默认情况下,Aspose.PDF 将 PDF 文档中的每一页转换为单独的工作表。但是,您可以自定义 API 以最大程度地减少大型 PDF 文档的工作表数量。以下是执行此操作的步骤。
- 使用Document类加载输入的 PDF 文档。
- 创建ExcelSaveOptions类的实例。
- 设置选项ExcelSaveOptions.setMinimizeTheNumberOfWorksheets(true)。
- 将 PDF 保存为 XLSX。
以下代码示例展示了如何使用 Java 以最少的工作表数量将 PDF 转换为 XLSX。
结论
在本文中,您已经了解了如何使用 Java 将 PDF 转换为 Excel XLS 或 XLSX 文件。此外,在代码示例的帮助下,还讨论了最大限度地减少 PDF 转 Excel 中工作表数量的功能。您可以使用文档探索有关 Aspose.PDF for Java 的更多信息。