当您需要将表格数据从PDF文档导出到Excel电子表格时,PDF到Excel的转换是一个重要的用例。当您处理大量文档时,手动将数据从PDF复制/导出到Excel可能是一项耗时的工作。那么,为什么不自动化该过程并最大程度地减少时间和精力呢?在本文中,您将学习如何使用C#.NET将PDF转换为Excel。
在C#.NET中将PDF转换为Excel
本文介绍了以下使用C#的PDF到Excel的转换。
- 将PDF转换为XLS格式。
- 将PDF转换为XLSX格式。
- 在转换后的Excel工作表中插入空白的第一列。
- 最小化转换后的Excel电子表格中的工作表数量。
对于用C#将PDF转换为Excel,我们将使用.NET API的Aspose.PDF,该API支持创建和处理PDF文档以及将PDF文件转换为其他格式。您可以下载API的DLL或使用以下方式之一安装它。
通过NuGet软件包管理器安装
- 在Visual Studio中打开/创建项目。
- 转到NuGet软件包管理器,然后搜索Aspose.PDF。
- 安装API。
通过Package Manager控制台安装
PM> Install-Package Aspose.PDF
在C#中将PDF转换为XLS
为了将PDF文档转换为XLS电子表格,您可以简单地加载PDF文件并以“ .xls”扩展名保存。下面的代码示例演示如何使用C#将PDF转换为XLS格式的Excel。
PDF文件
转换的Excel电子表格
在C#中将PDF转换为XLSX
默认情况下,Aspose.PDF将PDF文档转换为XLS格式。如果要获取转换后的XLSX格式的Excel电子表格,则可以使用ExcelSaveOptions类进行指定。下面的代码示例演示如何使用C#将PDF文档转换为XLSX格式的Excel。
使用空白的第一列将PDF转换为Excel
您也可以在转换后的Excel电子表格中插入空白的第一列。可以使用ExcelSaveOptions.InsertBlankColumnAtFirst选项完成此操作,如下面的代码示例所示。
使用最少的工作表数将PDF转换为Excel
默认情况下,输入PDF文档中的每个页面都将转换为单独的工作表。对于具有许多页面的大型PDF文档,转换后的Excel电子表格还将包含许多工作表。在这种情况下,您可以使用ExcelSaveOptions.MinimizeTheNumberOfWorksheets选项自定义PDF到Excel的转换,并最小化转换后的电子表格中的工作表数。
下面的代码示例显示如何使用C#将PDF转换为Excel的工作表的数量减至最少。
在此处阅读有关.NET的Aspose.PDF的更多信息。
相关文章)