国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

楼主: 汉文学士

[工具] PDF 补丁丁0.5.0.2520(测试版)解除PDF文档的烦恼

  [复制链接]
 楼主| 发表于 2011-4-12 18:39 | 显示全部楼层
回复 123# thelight


   是否可提供你需要的功能的示意图?
发表于 2011-4-13 19:24 | 显示全部楼层
了解,学习了。谢谢分享。
发表于 2011-4-17 14:14 | 显示全部楼层
回复 13# 100doudou


    zhege这个版本很强大,使用说明也很厉害,我在Apabi中也用不了。不过,很高兴啊。还是PDF的大部分版本软件都可以用的
 楼主| 发表于 2011-4-17 23:11 | 显示全部楼层
回复 125# wethilly


   楼上的兄弟在说啥子呀?《使用说明》采用了比较高的压缩比,也许 Apabi 支持的 PDF 版本太低无法识别,还是用别的 PDF 阅读器(如 Adobe Reader、PDF XChange Viewer 或 Foxit Reader)阅读吧。

评分

1

查看全部评分

发表于 2011-4-18 15:34 | 显示全部楼层
真的好用加油!
发表于 2011-4-28 06:51 | 显示全部楼层
感谢楼主 好的书签制作 有利于更方便地看电子书
发表于 2011-5-1 16:49 | 显示全部楼层
回复 1# comme
好东西,多谢楼主
发表于 2011-5-11 13:24 | 显示全部楼层
期待“comme ”的好东西早日成功
发表于 2011-5-15 07:38 | 显示全部楼层
感谢好软件 下载慢慢学习!!!
发表于 2011-5-19 13:57 | 显示全部楼层
多谢comme 大侠,软件易用、功能强劲。
发表于 2011-6-4 09:01 | 显示全部楼层
好东西,先从楼主的认真态度上认可了,下来试试。
发表于 2011-6-8 23:18 | 显示全部楼层
这样啊,还不知道呢。
 楼主| 发表于 2011-7-1 18:41 | 显示全部楼层
今天发布0.3.2正式版。
有问题或建议请留言,请勿发表纯感谢帖!!
 楼主| 发表于 2011-7-4 10:46 | 显示全部楼层
0.3.2.40版修复了批量导出图片时输出目录的问题。
发表于 2011-7-6 10:22 | 显示全部楼层
不错,满好用的,多谢楼主了!
发表于 2011-7-9 07:56 | 显示全部楼层
不错,谢谢楼主。
发表于 2011-7-13 11:51 | 显示全部楼层
几天前都一直在找有OCR的PDF呢,今天想想来国典真是来对了。
发表于 2011-7-22 23:25 | 显示全部楼层
以前下载的一些PDF格式的电子书苦于没有书签每次都要用笔记载,现在有了阁下的东东应该会好些吧。
发表于 2011-7-25 15:13 | 显示全部楼层
看起来功能好像很强大,下载下来实践一番。感谢楼主。
发表于 2011-8-1 23:58 | 显示全部楼层
有个这工具 做目录非常 方便了,
特来感谢楼主
发表于 2011-8-5 11:47 | 显示全部楼层
谢谢,用了感觉很好,楼主很有心。
发表于 2011-8-5 22:16 | 显示全部楼层
好东西收下了 谢谢
发表于 2011-8-25 17:34 | 显示全部楼层
win7下不能用。
发表于 2011-8-25 18:47 | 显示全部楼层
Pdf的软件很多,查看的功能不大全,功能全的占空间太大,不知这个补丁效果如何?有用过的最好说明一下。

点评

功能不全,小制作而已。解决一些软件不提供的功能,例如以比较特殊的方式编辑书签、无损提取 PDF 图片等。  发表于 2011-8-26 08:57
发表于 2011-9-1 11:24 | 显示全部楼层
蚩招 发表于 2011-2-8 08:31
foxit也有OCR了,好像是abbyy的模块,可惜没繁简中文
Foxit OCR Add-on module is designed to work with F ...



  Foxit嵌入ABBYY模塊應該不可能的,ABBYY沒有提供調用接口吧。

  如果ABBYY開放,那comme和老馬先都要樂瘋+忙死了,ABBYY的識別率遠遠不是微軟MODI能比的呃。



发表于 2011-9-1 11:42 | 显示全部楼层


  看完了全部回帖,首先對comme的辛苦和創造很佩服。

  其次,前幾個星期很仔細地試過OFFICE 2010現在的OCR功能,也就是One Note打印到的功能,總體來説識別率不算是很高,有些失望。

  第三,現在裝的是ABBYY finereader 10,基本功能我覺得已經很強大了。
  遺憾是不能完整再現PDF或word的格式,只能部分保留或轉換出,這個如果是少數標題抽提為書簽,還能手動處理,如果是做大量内容書簽的細目整理,就相當費時間了(當然要比原先純手工處理已經強不知道哪裏去了);
  另一個遺憾是到10爲止,ABBYY對亞洲語言還都不支持學習和用戶自定義模式,這樣就無法通過反復識別和修正提供分辨率,對於非標準的印刷體識別率就不夠高(手寫體如古鈔本就更難了,大概一般只能識別10%左右,必須而且只能靠學習模式來慢慢提高的)。

  沒確定的一點,是ABBYY對於亞洲語言的OCR,是否能調用系統内所有的字體庫支持,我在使用中感覺它好像只是輸出和顯示環節可以調用系統載入的所有字體庫似的。這一點其實對於電子書識別/處理/製作也是非常非常重要的。

  説到底,還是國内缺少自己的中文字體識別的算法和引擎問題吧,美國或俄羅斯的軟件開發縂不可能以中文微優先。

  前幾天好像ABBYY finereader 11正式發佈了,不知道上面說的幾個問題改善沒有。


  現在電腦裏裝很久win7 + Office 2010 + Acrobat Xpro了,但對電子書識別和處理的需求,又要至少ABBYY finereader 10甚至更好的功能,特別是古文獻資料的整理職別,還有書簽索引及檢索功能。

  很期待有個強力OCR+靈活書簽+超級檢索的組合解決方案,那就真真是功德無量了,很多國學方面的工作都能以N倍甚至N次方的速度推行和進展了。。





 楼主| 发表于 2011-9-1 12:42 | 显示全部楼层
ABBYY的识别率的确不错。我估计它是可以通过调用系统字库,并将字体形状与图片文本相比对来提高识别率的。刚好我系统装的字体极多,结果导致程序耗用内存过多。破机器在内存不足的时候就会自动重启,完全无法识别。
近来手头上的工作很多,只有修复 BUG 的一点精力,开发程序新功能的计划就只好暂时搁置了。
发表于 2011-9-1 13:13 | 显示全部楼层
有没有用哦。。。
发表于 2011-9-1 21:59 | 显示全部楼层
好东西,试试再说
发表于 2011-9-12 10:25 | 显示全部楼层
刚下载试用,和DjVuToy有异曲同工之妙。
试用了两项功能:
一、提取图片
和DjVuToy的“转为图像”类似,比Ap PDF to IMAGE更好用。
可以无损导出图片,这一功能非常实用。原先在本坛下载过一本《快速识别形似字》,原制作者可能不熟悉pdf制作,图片四周留下很宽的白边。无损导出图片后,重新制作pdf,效果就好多了。
二、识别图像文本
和DjVuToy的“文本相关”OCR功能相近。DjVuToy在OCR后能将文本直接嵌入DjVu电子书,重新打开电子书,能选定相关的文本。不知本软件能否增加“嵌入”功能?
最后,要特别感谢楼主。

点评

嵌入识别文本到PDF的功能正在公开测试,请见软件网志  发表于 2011-11-7 07:49
会考虑增加嵌入识别文本的功能。  发表于 2011-9-13 14:14
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

站长推荐上一条 /2 下一条

小黑屋|手机版|Archiver|国学数典 ( 2006-2020 冀ICP备19008975号-2 )在线客服

GMT+8, 2021-5-13 21:38

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表