用Adobe Acrobat 7.0 Professiona l打开一篇PDF文档,
“文件” 菜单——“另存为”——“保存类型:JPEG(*.jpg
*.jpeg *.jpe) ”——“保存”。
稍等一会儿,整篇PDF文档就变成一幅幅图片了。
Adobe Acrobat 7.0 Professiona l使命完成。
尚书七号OCR
“文件” 菜单——“打开图像”——“文件类型:全体图像
(*.tif *.bmp *.jpg)
(2)开始识别。
“选择全部文件”按钮——“开始识别”按钮
稍等一会儿,所选图片就变成文本了。
(3)必须校对。
逐幅图片进行校对,时间紧的话着重校对红色部分,这是识别软
件认为需人工校对的部分,但是不要迷信,没有标出的地方还是
有错的。
不要听OCR厂家“识别率超过98%”的一派胡言,校对过程绝对是
折寿的,我从网上下载了人文2005版鲁迅全集18卷,到现在一卷
也没有识别完……
(4)合成输出。
“选择全部文件”按钮——“输出”菜单——“到指定格式文件
”命令——“保存类型:txt”——“输出到外部编辑器”——
“保存”
(5)记事本编辑。