汉王PDF OCR V8.1对软件进行全面升级,是汉王ocr文字识别和尚书七号的升级版,是一个带有 PDF 文件处理功能的 OCR 软件;具有识别正确率高,识别速度快的特点。有批量处理功能,避免了单页处理的麻烦;支持处理灰度、彩色、黑白三种色彩的BMP、TIF、JPG、PDF多种格式的图像文件;可识别简体、繁体和英文三种语言;具有简单易用的表格识别功能;具有TXT、RTF、HTM和XLS多种输出格式,并有所见即所得的版面还原功能。新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别,既可以采用OCR的方式将PDF文件转换为可编辑文档,也可以采用格式转换的方式直接转换文字型PDF文件为RTF文件或文本文件。
1.打开汉王,打开PDF文件,提示拆分页,确定,就自动识别页和拆分页。2.再选择第1页,按住SHIFT,用鼠标滑动到最后一页,选择最后1页,相当于全部选择页;3.按F8开始自动识别,会识别到 \My Documents\My Hwdoc Files\HWPDFOCR80\IMAGE 目录下;4.因是按页识别的,要合并TXT文件。在识别的TXT文件目录(\My Documents\My Hwdoc Files\HWPDFOCR80\IMAGE 目录下)下,建立一个纯文件文件,比如取名为:合并.TXT,改扩展名为BAT:合并.BAT选择,鼠标右键,选择编辑,输入1个语句:copy *.txt 合并.txt或type *.txt >> 合并.txt两种方法都可以,选择一种就行,保存退出;双击这个批处理程序,就把当前目录下所有单页TXT文件,合并成1个TXT文件。记住只点击一次就行了,点击多了会重复合并。