国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 3746|回复: 11

[工具] 汉王pdf ocr V8.1.4.16 汉化破解版

[复制链接]
  • TA的每日心情
    无聊
    2021-2-28 13:33
  • 签到天数: 887 天

    [LV.10]以坛为家III

    发表于 2013-8-10 10:39 | 显示全部楼层 |阅读模式
    汉王pdf ocr汉化破解版8.1是汉王OCR 6.0 和尚书七号的升级版,新增PDF文件的处理功能,可以把PDF文件(包括文本型和图片型)转化为可编辑的各种文档,如(PDFTOWORD、PDF2WORD)或(PDFTOTXT、PDF2TXT)。本软件对个人用户免费,无需注册,无功能限制



    点击下载

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x

    点评

    多谢兄台  发表于 2014-1-16 09:41
    谢谢分享  发表于 2013-8-10 11:20
  • TA的每日心情
    开心
    2018-8-28 17:15
  • 签到天数: 3 天

    [LV.2]偶尔看看I

    发表于 2013-8-10 12:26 | 显示全部楼层
    谢谢分享,帮助甚大

    该用户从未签到

    发表于 2013-8-10 12:44 | 显示全部楼层
    这个只能算是很旧的软件了哇

    顶端的广告条很占用空间,谁能把它干掉?
  • TA的每日心情
    开心
    2018-11-26 16:08
  • 签到天数: 5 天

    [LV.2]偶尔看看I

    发表于 2013-8-10 15:32 | 显示全部楼层
    看介绍像是很不错的样子,实际应用效果不知道如何?识别率有多高?
  • TA的每日心情
    擦汗
    2019-6-3 22:43
  • 签到天数: 34 天

    [LV.5]常住居民I

    发表于 2013-8-10 17:58 | 显示全部楼层
    版权声明

    《汉王PDF OCR》V8.0 版权属于汉王科技股份有限公司所有。本公司免费授权您非商业用途任意使用和复制本软件,包括在任意多台计算机上同时使用本软件。但在未经许可的情况下,不得将本软件用于商业用途。未经汉王科技股份有限公司许可与授权,不得擅自更改该软件的内容及其产品包装。
    本软件受版权法和国际条约的保护。
    版权所有, ! @ 汉王科技股份有限公司。

    产品特点

       汉王PDF OCR是汉王OCR 6.0 和尚书七号的升级版,本软件新增打开与识别PDF文件功能,支持文字型PDF的直接转换和图像型PDF的OCR识别:既可以采用OCR的方式,将PDF文件转换为可编辑文档;也可以采用格式转换的方式直接转换文字型PDF文件为文本。
       本软件系统应用OCR(Optical Character Recognition)技术,为满足书籍、报刊杂志、报表票据、公文档案等录入需求而设计的软件系统。
       目前,许多信息资料需要转化成电子文档以便于各种应用及管理,但因信息数字化处理的方式落后,不但费时费力,而且资金耗费巨大,造成了大量文档资料的积压,因此急需一种快速高效的软件系统来满足这种海量录入需求。本软件系统正是适用于个人、小型图书馆、小型档案馆、小型企业进行大规模文档输入、图书翻印、大量资料电子化的软件系统。
    ●识别字符
    简体字符集:国标GB2312-80的全部一、二级汉字6800多个。
    纯英文字符集。
    简繁字集:除了简体汉字外,还可以混识台湾繁体字5400多个以及香港繁体字和GBK汉字。
    ●识别字体种类
    能识别宋体、仿宋、楷、黑、魏碑、隶书、圆体、行楷等一百多种字体,并支持多种字体混排。
    ●识别字号
    初号 小六号字体。
    ●表格识别
    可以自动判断、拆分、识别和还原各种通用型印刷体表格。



    初始设置

    安装扫描仪
       第一次使用扫描仪或者更换扫描仪时,都需要对扫描仪进行驱动安装和设置。请先按照扫描仪使用手册上的步骤正确安装扫描仪,然后打开应用程序,在应用程序界面内,按下“文件”菜单下的“选择扫描仪”命令,选择相应的扫描仪,如图所示:


    系统设置 
       从“文件”菜单中点“系统配置”命令,进入系统设置界面,设置扫描任务的语言。如图所示:

      
       支持的扫描任务语言有:中文简体、简繁混合、纯英文等。
       如果选中“灰度彩色图像总存为JPG”,那么系统会自动将灰度彩色图像扫描保存成JPG格式。
       如果选中“识别”页中的“自动倾斜校正”,在版面分析时,系统会自动校正倾斜的图像文件。如图所示:




    操作详解

    操作界面
        工程图像识别界面包括主菜单、工具栏、图像文件管理区、侯选字区、识别结果区以及原图像显示区,如图所示:



    文件管理区:对文件进行管理和整理。
    1.打开文件:选择“文件”菜单,选择打开图像文件的路径,图像文件便显示在管理区用鼠标可将图像文件拖拽到管理区,也可将打开的图像页复制、粘贴到管理区。
    2.删除文件:按键盘上的“Delete”键将文件删除。
    3.调整文件:选中一个文件或按住Ctrl可以选择多个文件,把文件拖放到要调整的位置。
    4.文件格式:本系统支持TIF、BMP、PDF,彩色灰度图还支持JPG格式。
    5.文件语言:本系统支持中文简体、英文、简繁体混排方式、以及中英文混排方式。
    6.图像文件重命名:选中文件,点击文件菜单选择可保存成TIF、BMP、JPG文件(说明:本系统不支持批量图像文件的改名)。
    7.图像文件保存路径:在中可以设置获取图像文件的路径、名称、格式。如该路径不存在,系统会提示是否创建该路径;如果要选择已存在的某个路径,可以点击“扫描到”按钮,弹出选择路径对话框,选择需要保存图像的路径。
     
    侯选字区:修改识别结果时,可以选择侯选区的字直接修改当前字。
     
    识别结果区:显示当前图像文件的识别结果。 
    原图像区:显示当前正处理的图像。
    搜索区:百度、Google搜索。

    获取图像
    获取图像
       获取图像有四种方式:通过点击工具栏上的按钮打开已扫描好的图像文件;通过扫描仪批量扫描文稿;用鼠标将图像文件拖拽管理窗口;将打开的图像文件复制、粘贴到文件管理器中。
       扫描文稿时,先准备好扫描仪,点击工具栏上的进入扫描程序,将要扫描的稿件放置在扫描仪的适当位置上,屏幕上显示扫描仪配置窗口(这里以扫描仪AV620C为例)。在扫描之前,可以通过扫描窗口选择扫描精度、扫描方式和纸张大小。
       本系统支持黑白二值模式、灰度模式以及彩色模式,即选择黑白扫描方式、灰度扫描方式和彩色扫描方式。建议不要大量采用灰度、彩色扫描模式扫描文件,因为彩色图像文件占用大量的内存和CPU,操作速度会很慢;而且背景图案会影响处理效果。
       
    扫描亮度
       亮度选择是否恰当直接关系到图像的清晰度,而图像的清晰度又直接影响后续的识别质量,因此必须根据稿件的实际质量来选择亮度。所要达到的扫描质量为保证每个扫描汉字的图像清晰,不能出现过浓或过淡。
       
    扫描精度
       对于其它类型的扫描仪可参照相应的使用手册进行选择。对于本系统而言,扫描精度控制在300dpi为好,这样既可保证良好的识别效果,又能减少扫描操作所需时间。
       扫描之后的图像直接传送回本系统的图像处理界面。图像文件自动存储到系统默认路径下的默认文件名,文件名和识别参数显示在管理条窗口内。(扫描的具体操作请参考扫描仪使用手册)。

    处理图像
    图像反白
       本功能只处理白底黑字的图像,若扫描得到的图像不是白底黑字,点“编辑”菜单中的“图像反白”命令作反白处理。
       
    旋转图像
       若发现当前图像不是正常位置显示,选择“编辑”菜单内的“旋转图像”菜单项,再选择相应的旋转方向,按90度旋转当前图像(可以连续旋转),将当前图像旋转到正常位置。
       
    倾斜校正
       自动倾斜校正:
       若扫描后的图像是倾斜的,按系统测定的角度自动倾斜校正。选择“编辑”菜单的“自动倾斜校正”,可以对倾斜的图像作自动倾斜校正使之正常显示。

       手动倾斜校正:
       若图像是倾斜的或自动倾斜校正效果不佳,可选择“编辑”菜单的“手动倾斜校正”,出现界面如图所示:


     
    手工调整横竖坐标,用鼠标点住图中水平红线左边的小方块,上下移动,使得水平线条与文本图像的倾斜角度一致;也可以用键盘上的上下箭头在按钮间切换,进行校正操作。
     
    去除噪声
       调整边框
       若发现当前的图像带有多余的版面噪音,可以调整当前图像的图像框范围,将多余的或影响版面分割和识别准确率的版面噪音(扫描过程产生的黑线条、黑污点等)删去,以提高识别准确率。
       点击使用鼠标将光标箭头移动到当前图像边框处,此时箭头变为卡住图像边框的上下双箭头。按下鼠标左键,将该位置的图像边框向内移动,将多余的版面噪音框掉,有效图像为当前图像框范围内的图像。

       剪切噪音
       点击工具栏中的按钮,按住鼠标左键,拖动鼠标选中图像中的噪音(黑点或黑框),放开鼠标左键,就可以将噪音清除。
       
    辅助操作
       缩放图像
       可根据操作需要调整当前图像显示的大小。选择工具栏按钮或按钮,将当前图像做放大或缩小处理。如果在当前图像内双击鼠标“左键”,会放大显示图像;双击鼠标“右键”,会缩小显示图像。

       恢复鼠标
    当前鼠标为剪刀、画笔状态时,根据操作需要,点击按钮可切换到鼠标状态。

    分析图像
       在版面分析前,先检查文件管理窗口内当前文件的语言,如果有误,请双击该参数,在下拉菜单内选定正确的识别参数。   

    自动版面分析
       单击工具栏的按钮,或选择“识别”菜单内选择“版面分析”命令,自动对当前文件或管理窗口内选定的一批文件进行版面分析。
       若单击按钮,或选择“识别”菜单上的“选择全部文件”命令,将全部文件选中,进行版面分析时,系统自动对全部图像文件进行版面分析。

    调整分析结果
       移动光标箭头到文件图像上的待调整图像框,点击1、2、3、4、5键,将当前框的属性标识为横栏、竖栏、表格、图像、英文;若框切分不对,可单击工具栏中的按钮,或选择“识别”菜单内的“取消当前栏”,取消当前栏重新画框;若整页切分错误较多,可单击工具栏中的按钮,或选择”识别”菜单内的“取消版面分析”,取消图像页的全部版面分析,手动进行版面分析。
       在调整分析结果时,如果框的范围包含了其它属性框,被包含的框自动消失;当框的范围与已有的属性框交叉时,调整框大小无效。
       
    手工版面分析
       移动光标箭头到文件图像上的适当位置(例如文章段首),按住鼠标左键不放,拖动至另一适当位置(例如文章段尾),再放开左键,划分出所要识别的图像框图(见图像框线),重复此操作,以划分出全部图像框的框图。
       另外,还可以定义各图像框的版面属性为横栏、竖栏、表格、图像。
       此外,移动光标箭头到文件图像上的待排序图像框内,按住鼠标左键不放,显示出蓝色箭头拖动至另一图像框内,再放开左键,以指定图像框的识别顺序(顺序标号在框线左上角),重复此操作,以指定文件全部图像框的识别顺序。
    在已有版面分析的图像文件上重新画框时,如果框的范围包含了已有的属性框,被包含的框自动消失;当框的范围与已有的属性框交叉时,手动画框无效。
     

    识别图像
    识别图像
       选中要识别的图像页,点击按钮或选择“识别”菜单上的“开始识别”命令,对所选图像进行版面识别。当然也可以用“F8“快捷键识别选中图像。识别处理窗口如图所示:

      
       说明当前正在识别的文件;说明选中的要识别的文件数。
       
    检查识别结果
       识别过的图像,系统会将识别结果在识别窗口中显示出来。如果没有识别的图像,识别窗口为灰色,所以识别完图像后,应该检查有没有图像页是否有没识别的图像块。

    校对
    调整窗口显示
       单击“显示”菜单,调出菜单如图所示:
     
       做横校时,可以根据需要选择显示/关闭工具条、状态条、管理条及文本窗口;也可以选择显示方式:如显示全部,只显示管理条,只显示图像、文本方式。
       另外,横校窗口中有三个控制窗口按钮,单击它们,可以调整文本窗口的结构和布局。如图所示:
        
    1、/:隐藏/显示识别结果的文本窗口。
    2、/:隐藏/显示侯选字、联想字以及符号修改栏。
    3、/:隐藏/显示光标当前行的对应原始图像。
     
    字符校对
    1、字符校对:对照随行显示的当前字符的原始图像校正识别结果。
    2、字符修改:选择当前字的候选字替换识别有误的字,也可以调出输入法输入正确的字符。
    3、字符编辑:在文本编辑区内可以进行退格、删除、撤消等操作,在窗口最下面的状态栏的或处单击,可以切换字符的键入方式。在“编辑”菜单内选择“剪切”“复制”或“粘贴”,可以对选定的文字做相应的操作。 
    保存图像
    在工程操作时,想将经过处理后的图像保存,可以点“文件“菜单下的“保存图像”命令进行保存;如果想将处理后的图像文件保存到其它位置,可以点“文件”菜单下的“换名保存图像”命令,将图像文件换名保存。

    结果输出
    输出到指定格式文件
       校对完成后的图像文件可以输出保存成文字处理软件(如WORD、WPS97等)可处理的文件,还可以保存成文本文件。点“输出”菜单,选择“到指定格式文件”,在弹出的“保存识别结果”窗口中,用户可以选择文件要存储的路径和文件类型。本系统的识别结果可以保存成*.RTF、*.TXT、和*.HTML以及*.XLS四种格式的文件。

        
      如果选中“输出到外部编辑器”,则系统在保存文件的同时调入相应的文字处理程序。比如选择输出HTML格式,系统马上进入IE浏览器。
       TXT格式只保存文字、表格部分,不保存图片;
       RTF格式可以用WORD、WPS等文字处理软件编辑;
       HTML格式可以输出到IE等网络浏览器;
       XLS 格式可以用 Excel 等软件编辑。

    PDF文件转换为RTF文件
       打开PDF文件转换:点击“输出”菜单中“PDF转换为RTF文件”选项,或点击工具栏中“PDF转换为RTF”按钮,弹出下图对话框,您可以根据需要选择转换的图像页范围,点击“确定”,系统自动导出文件。



      直接转换:在打开图像时,如果您选择的是PDF图像,打开对话框下方“PDF转换为RTF文件”和“PDF转换为TXT文件”按钮可用,点击该按钮,直接将PDF文件转换为可编辑文件。
       特别提示:
    如果勾选“转换后打开RTF文件”,在转换后自动打开,如果不勾选则只转换保存文件,不打开。
    如果未安装Word,导出后不能正确打开浏览,只能生成文件。

    PDF文件转换为RTF文件
       打开PDF文件转换:点击“输出”菜单中“PDF转换为TXT文件”选项,或点击工具栏中“PDF转换为TXT”按钮,弹出下图对话框,您可以根据需要选择导出的图像页范围,点击“确定”弹出保存文件对话框,添加文件名,并点击保存后导出文件。


      
       直接转换:在打开图像时,如果您选择的是PDF图像,打开对话框下方“PDF转换为RTF文件”和“PDF转换为TXT文件”按钮可用,点击该按钮,直接将PDF文件转换为可编辑文件。
       如果勾选“转换后打开TXT文件”,在转换后自动打开,如果不勾选则只转换保存文件,不打开。
      


    快捷键与工具按钮

    快捷键

    扫描文件: 按下“Ctrl+N”调出扫描程序,扫描图像文件。
    打开文件: 按下“Ctrl+O”打开图像文件,追加图像文件。
    保存图像: 按下“Ctrl+S”键保存图像。
    图像反白: 按下“Ctrl+I”将图像反白。
    自动倾斜校正: 按下“Ctrl+D”进行自动倾斜校正。
    手动倾斜校正: 按下“Ctrl+M”进行手动倾斜校正。
    版面分析: 按下“F5”键,对选中的文件进行版面分析。
    取消版面分析: 按下“Ctrl+Del”键,取消当前页的版面分析。
    取消当前栏: 按下“Del”键或“Esc”键,取消当前栏属性标识。
    版面识别: 按下“F8”键,对选中的文件进行识别。
    光标切换: 按下“F9”键,光标在剪刀、画线笔、鼠标三种状态间切换。
    左转图像: 按下“Ctrl+L”将图像左转90度。
    右转图像: 按下“Ctrl+R”将图像右转90度。
    向后翻页: 按下“Page down”向后翻页。
    向前翻页: 按下“Page up” 向前翻页。
    撤消: 按下 “Ctrl+Z”键取消上一步操作。
    剪切: 按下“Ctrl+X”键剪切选中的内容。
    复制: 按下“Ctrl+C”键复制选中的内容。
    粘贴: 按下“Ctrl+V”键粘贴选中的内容。
    向后找可疑字: 按下“Ctrl+Tab”键。
    向前找可疑字: 按下“Shift+Tab”键。
    工具按钮


    :扫描图像。
    :打开扫描好的图像文件。
    :将PDF文件转换为RTF文件。
    :将PDF文件转换为TXT文件。
    :图像放大。
    :图像缩小。
    :选中全部图像文件。
    :对所选图像进行分析识别。
    :对所选图像版面分析。
    :取消选中图像页的版面分析。
    :标记/修改当前图像框的属性。
    :取消当前图像框属性。
    :将光标切换成鼠标状态。
    :去除版面噪音,如黑点、黑框等。
    :在图像页上画线,弥补断线处或将表格填补成标准表格。
    :向前/向后翻页。


    注意事项

    如果您的Windows操作系统未安装Flash插件,在启动程序时会提示下图信息,只需要点击“是”,执行安装即可。



    无论何种原因(如网络速度慢甚至网络不通),未安装该插件都会不停的提示下图信息,您只有关闭程序并安装Flash插件才可正常使用。




    联系我们

    如果您在使用过程中有任何问题,请首先准备好以下资料,并与我们联系。
    计算机型号和计算机上的外设清单
    操作系统类型及计算机硬件配置
    故障现象或屏幕上所显示的出错信息
    问题发生原因及问题发生时您的操作
    为解决这个问题您做了哪些尝试
    地址:北京市海淀区东北旺西路8号5号楼三层
    邮编:100094
    技术支持:hexia@hanwang.com.cn
  • TA的每日心情
    开心
    2019-4-13 17:40
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-8-11 11:05 | 显示全部楼层
    试了试,效果还算可以,什么软件也不可能做到100%准确。

    该用户从未签到

    发表于 2013-12-11 11:27 | 显示全部楼层
    对于汉王,我一直用的是 汉王文本王 文豪7600
    现在硬盘不是问题,但这个小软件多了几个,方便用。
  • TA的每日心情
    开心
    2021-2-28 00:03
  • 签到天数: 1075 天

    [LV.10]以坛为家III

    发表于 2021-2-15 21:49 | 显示全部楼层
    谢谢分享,帮助甚大
  • TA的每日心情
    开心
    2021-2-28 00:03
  • 签到天数: 1075 天

    [LV.10]以坛为家III

    发表于 2021-2-16 12:51 | 显示全部楼层
    汉王对于古代文史的研究说很接地气。
  • TA的每日心情
    开心
    2021-2-28 10:41
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2021-2-21 11:07 | 显示全部楼层
    请问楼主,扫描晚清、民国那种铅印排班的书,那个软件好用?一般的OCR软件胜任么?
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    小黑屋|手机版|Archiver|国学数典 ( 2006-2020 冀ICP备19008975号-2 )在线客服

    GMT+8, 2021-3-1 05:44

    Powered by Discuz! X3.4

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表