使用 Java OCR API 将图像转换为文本

使用 Java 执行 OCR

光学字符识别(OCR)技术已经使我们能够识别和扫描的文档和图像内读取的文本。OCR 可让您将只读文本转换为可编辑形式。可以进一步处理转换后的文本以进行文本分析等操作。在本文中,我将向您展示如何对图像(PNGJPGBMPGIF执行 OCR ,并使用 Java OCR API – Aspose.OCR for Java将图像转换为文本

Java OCR API – 安装

Aspose.OCR for Java 可以作为JAR下载或使用以下配置安装在基于 Maven 的应用程序中。

存储库

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>http://repository.aspose.com/repo/</url>
</repository>

依赖

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-ocr</artifactId>
    <version>20.5</version>
</dependency>

使用 Java 将图像转换为文本

大多数情况下,OCR 的图像是扫描文档、发票、收据、账单等的页面,其中文本由多行组成。在这种情况下,您需要从图像中检索整个文本。以下是使用 Aspose.OCR for Java 对具有多行文本的图像执行 OCR 的步骤。

以下代码示例展示了如何使用 Java 对图像执行 OCR 并将图像转换为文本。

转换具有单行文本的图像

在前面的示例中,我们对具有多行文本的图像执行了 OCR。但是,可能存在图像包含单行文本的情况。对于这种情况,您可以相应地配置 API。以下是转换具有单行文本的图像的步骤。

以下代码示例展示了如何使用 Java 对具有单行文本的图像执行 OCR。

结论

在本文中,您已经了解了如何使用 Java OCR API 将 PNG、JPG、BMP 和 GIF 图像转换为文本。代码示例展示了如何在 Java 应用程序中对具有单行或多行文本的图像执行 OCR。您可以使用文档了解有关 Aspose 的 Java OCR API 的更多信息

也可以看看