改进了多线程环境和文本操作中的内存使用情况

我们总是渴望提供具有增强和改进的API,我们的产品团队一直在努力实现新功能以及改进API的性能。我们很高兴地宣布具有令人兴奋的功能和改进的Aspose.Pdf for Java 17.11新版本可以下载了。请访问Aspose.Pdf for Java 17.11发行说明了解公共API更改和改进的概述。请检查以下关于API新版本中有关内存使用和文本操作的重大改进。

多线程环境下的内存使用情况

在以前的API版本中,当堆内存占用接近极限时,API用于引发异常。 在多线程环境中使用HOCR回调转换PDF文档时,特别注意到了这一点。 产品团队一直在努力实现功能,以原始格式从PDF中提取图像,所以内存消耗降到了显著水平。现有的用HOCR回调转换PDF的方法已经改进如下:

pdf.convert(callback, false, true);

在上面的代码行中,第一个布尔参数通知可搜索的文本应该是不可见的,而第二个布尔参数是用来通知内部图像应该返回原样,并且是真值。 convert()方法的这种增强带来了内存消耗方面的重大改进,并且已经测试了使用这种方法,程序比以前的方法变得更快了两倍。

确定下划线文字和改进的替换选项

在替换/删除PDF文档中的下划线文本时发现,文本被用来替换/删除,但下划线仍然被绘制。 我们已经实现了在任何文本编辑操作中在源文档中开始搜索文本下划线的机制。 TextFragmentAbsorber从文本中删除下划线,其中下划线不是实际文本的一部分,而是一个图形元素,并将其替换为原始下划线,就像它通过原始TextFragment的TextState添加的那样。

之后,如果使用TextFragment(或TextSragment)的TextState.Underline属性进行下划线,则将以相同的方式对受影响的片段(或片段)执行任何文本编辑操作。为了启用描述的机制,您可以在TextFragmentAbsorber (or PdfContentEditor)对象的TextEditOptions选项中将ToAttemptGetUnderlineFromSource设置为’true’。

其它修复

始终建议使用我们的API的最新版本,因为它们包括与早期发布的版本中报告的问题相关的最新功能/改进和修复。 因此,请下载最新版本的?Aspose.Pdf for Java 17.11。