[摘要]PDF Plain Text Extractor(pdf文件处理软件)是一款PDF文件处理工具,用户能够使用这款软件方便快捷的将PDF文件中的纯文本进行提取。软件使用方便,用户能够快速上手软件的使用...
PDF Plain Text Extractor(pdf文件处理软件)是一款PDF文件处理工具,用户能够使用这款软件方便快捷的将PDF文件中的纯文本进行提取。软件使用方便,用户能够快速上手软件的使用,并且软件支持多种语言的提取,还对处理器的运用进行了优化,让软件能够以更快的速度对文本进行提取。
基本简介
PDF Plain Text Extractor是从 pdf 文件中提取文本的强大工具。 它不需要来自 Adobe 的任何产品,您不需要花费 $xxx 购买 Adobe Acrobat 只是为了将您的 pdf 文件转换为纯文本文件。
PDF Plain Text Extractor是用 C++ 编写的,高性能和准确性是我们的目标。 处理引擎已从 3.015 升级到 4.420。 我们在这个版本中添加的最棒的功能是多字节语言支持。 PDF 纯文本提取器 4.4 支持英语、所有欧洲语言、简体中文、繁体中文、日语、韩语。 输出采用 UTF-8 格式,核心处理器进行了优化以获得更好的性能。
功能介绍
1. 它直接分析原始pdf文件,并从中提取纯文本,同时保留pdf文件的版面。
2.不需要任何第三方产品(例如Adobe Acrobat或Adobe Acrobat Reader)。
3.支持LZW编码的pdf文档。
4.支持英语,法语,德语,意大利语和其他语言。
5.您可以拖放pdf文档以完成转换。
6.可以转换整个文件夹(递归与否)。
7.一次可以转换来自硬盘驱动器不同位置的pdf文件。
8.可以保存转换的pdf文件列表以备将来使用。
9.可以输出文件的页面范围。
10.可以将分页符字符串设置为单独的页面。
11.可以用分页符字符串设置输出页码。
12.可以通过图形用户界面浏览pdf文件的信息(标题/作者/创建日期...)。
13.可以选择将pdf文件的信息输出到输出文本文件。
14.可以设置单个pdf文件或转换列表中所有pdf文件的输出文件夹。
15.支持uni code,多字节语言。
16.支持Type0,Type1,Type3,TrueType,CIDFont字体。
软件特色
PDF Plain Text Extractor是一款可以帮助您将“便携式文档格式”文件中的文本保存到单独文档中的软件。
该程序的用户界面简洁明了,易于浏览。因此,您可以使用文件树视图或“拖放”方法将文件添加到列表中(支持批量转换)。
您可以查看文件夹中包含的每个PDF文件的名称,大小和修改日期,以及其标题,主题,作者,创建者,生产者,创建日期和关键字。
您可以指定输出目标,预览PDF(如果安装了兼容程序),启用输出过程详细信息和输出过程时间,以及设置页面范围,分隔符和编号。
此外,您可以启用PDF纯文本提取器来覆盖现有文件,并将输出与源文件放置在同一文件夹中,保存转换列表,从列表中删除文件,等等。
该程序使用非常少的系统资源,并包含一个全面的帮助文件(带有快照)。在我们的测试过程中,它没有冻结或崩溃,并且设法提取了除英语以外的其他语言中的特殊字符。
另一方面,当尝试从带有图像或表格的PDF文件中提取文本时,该软件遇到较小的格式设置问题。
总而言之,即使是菜鸟,也可以轻松使用PDF Plain Text Extractor。强烈建议您使用该程序将PDF转换为文本。
应用软件是为满足用户不同领域、不同问题的应用需求而提供的那部分软件。 它可以拓宽计算机系统的应用领域,放大硬件的功能。