该光学字符识别(OCR)技术已经使我们能够识别和扫描的文档和图像内读取的文本。OCR 可让您将只读文本转换为可编辑形式。可以进一步处理转换后的文本以进行文本分析等操作。在本文中,我将向您展示如何对图像(PNG、JPG、BMP和GIF)执行 OCR ,并使用 Java OCR API – Aspose.OCR for Java将图像转换为文本。
Java OCR API – 安装
Aspose.OCR for Java 可以作为JAR下载或使用以下配置安装在基于 Maven 的应用程序中。
存储库
<repository>
<id>AsposeJavaAPI</id>
<name>Aspose Java API</name>
<url>http://repository.aspose.com/repo/</url>
</repository>
依赖
<dependency>
<groupId>com.aspose</groupId>
<artifactId>aspose-ocr</artifactId>
<version>20.5</version>
</dependency>
使用 Java 将图像转换为文本
大多数情况下,OCR 的图像是扫描文档、发票、收据、账单等的页面,其中文本由多行组成。在这种情况下,您需要从图像中检索整个文本。以下是使用 Aspose.OCR for Java 对具有多行文本的图像执行 OCR 的步骤。
- 创建AsposeOcr 类的实例 。
- 通过传递图像的路径,使用AsposeOcr.recognizePage(String fullPath)方法将图像转换为文本。
- 将转换后的文本转换为字符串对象。
以下代码示例展示了如何使用 Java 对图像执行 OCR 并将图像转换为文本。
转换具有单行文本的图像
在前面的示例中,我们对具有多行文本的图像执行了 OCR。但是,可能存在图像包含单行文本的情况。对于这种情况,您可以相应地配置 API。以下是转换具有单行文本的图像的步骤。
- 创建AsposeOcr 类的对象 。
- 使用AsposeOcr.recognizeLine(String fullPath) 方法将图像转换为文本。
- 将结果放入一个字符串对象中。
以下代码示例展示了如何使用 Java 对具有单行文本的图像执行 OCR。
结论
在本文中,您已经了解了如何使用 Java OCR API 将 PNG、JPG、BMP 和 GIF 图像转换为文本。代码示例展示了如何在 Java 应用程序中对具有单行或多行文本的图像执行 OCR。您可以使用文档了解有关 Aspose 的 Java OCR API 的更多信息。