国学数典

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 274|回复: 15

[讨论] 怎么搞定epub、mobi、text这类电子书的页码?

[复制链接]
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

    发表于 2021-1-22 23:51 | 显示全部楼层 |阅读模式
    本帖最后由 gongqi 于 2021-1-22 23:54 编辑

    普通阅读是不需要搞定页码的。但是学术性阅读则是必须的。因为引用时你需要写出引用内容在书里的页码。
    扫描版的pdf自然是没问题的,但其它可以根据字号和屏幕大小自动改变每页字数的文档就有大问题了,因为页码根本就是不确定的。
    可以有很多办法。有的麻烦,有的比麻烦更麻烦。
    想到的一个比较简便的思路是,从购书网站搞到原版纸质书的总页数,然后修改软件的字号,让软件重新排版后的总页数等于查到的总页数。比如SumatraPDF,在设置》高级选项的text里改FontSize。
    这个方法的缺点是无法完全准确,当然由于文档性质可能也是无法做到完全准确的。而且字号可能大0.1页数就多好几页,因而增加了误差。而且你需要减掉封面、版权页、序言、目录等的页数。
    一个改进的方法是人工校准,比如对正文第1页和最后一页校准。如果能得到一个简单公式当然最好,否则一个复杂的公式等于一道复杂的数学题。所以有时候这是有点麻烦的。
    也许你会说买本书或去图书馆查一下不就行了?但有时候因为种种限制还真就不方便,比如要看的书太多,还有疫情情况下。
    肯定有更好的方法。坐等赐教。
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-2-13 00:15 | 显示全部楼层
    momo5269 发表于 2021-1-23 01:44
    调整字体也不行,因为版式中的段落缩进一直有变化。
    也见过一些选用章节段行,没标页数的。但多是古籍。
    读 ...

    对于epub或mobi,可以调整它们页数的软件试了几个都不太方便,更不太准确。

    现在改用word了。就是把它们转换为word文件,然后在word里调整页边框和页眉页脚的大小。昨天找到了一本英文书的带页码的目录,然后将其epub文件转换为docx,再用最后一章的页码调了一下,回头再去看几个章节的起始页码,居然都是一点不差,目前觉得这就是最好的解决方案了。

  • TA的每日心情
    开心
    2020-12-29 13:35
  • 签到天数: 90 天

    [LV.6]常住居民II

    发表于 2021-1-23 00:07 | 显示全部楼层
    这个没办法。除非在做成这三种格式的时候加入页数。就像中华书局的籍合网那样。
    页数加在此页的最后一个字后面。
  • TA的每日心情
    开心
    2020-12-29 13:35
  • 签到天数: 90 天

    [LV.6]常住居民II

    发表于 2021-1-23 00:14 | 显示全部楼层
    就像这样的。

    本帖子中包含更多资源

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
  • TA的每日心情

    2021-2-28 10:27
  • 签到天数: 473 天

    [LV.9]以坛为家II

    发表于 2021-1-23 01:44 | 显示全部楼层
    调整字体也不行,因为版式中的段落缩进一直有变化。
    也见过一些选用章节段行,没标页数的。但多是古籍。
    读秀也能搜倒不少,但新出版物又不行。只能无解了。
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-1-23 11:25 | 显示全部楼层
    jiangxuan 发表于 2021-1-23 00:07
    这个没办法。除非在做成这三种格式的时候加入页数。就像中华书局的籍合网那样。
    页数加在此页的最后一个字 ...

    涨姿势了。还有这么操作的。
    想了想,也只有这样了。
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-1-23 21:47 | 显示全部楼层
    momo5269 发表于 2021-1-23 01:44
    调整字体也不行,因为版式中的段落缩进一直有变化。
    也见过一些选用章节段行,没标页数的。但多是古籍。
    读 ...

    是啊。字体对页码的影响更小了。
    有的epub或mobi制作,连章节的分页都不做,那你怎么弄都是枉然。
    只能校准个大概了。
    对于做笔记来说,尤其是仅仅是是文科方面的灵感上的启发,大概也就凑合了。
  • TA的每日心情
    开心
    2021-2-28 11:19
  • 签到天数: 624 天

    [LV.9]以坛为家II

    发表于 2021-1-23 22:12 | 显示全部楼层
    一般是参考中华书局的做法,在段落前标注P1、P2,但是搜索也是个问题,查关键词或制作书签都没有PDF或PDG方便。
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-2-13 00:15 | 显示全部楼层
    momo5269 发表于 2021-1-23 01:44
    调整字体也不行,因为版式中的段落缩进一直有变化。
    也见过一些选用章节段行,没标页数的。但多是古籍。
    读 ...

    对于epub或mobi,可以调整它们页数的软件试了几个都不太方便,更不太准确。

    现在改用word了。就是把它们转换为word文件,然后在word里调整页边框和页眉页脚的大小。昨天找到了一本英文书的带页码的目录,然后将其epub文件转换为docx,再用最后一章的页码调了一下,回头再去看几个章节的起始页码,居然都是一点不差,目前觉得这就是最好的解决方案了。

  • TA的每日心情

    2021-2-28 10:27
  • 签到天数: 473 天

    [LV.9]以坛为家II

    发表于 2021-2-13 00:49 | 显示全部楼层
    本帖最后由 momo5269 于 2021-2-13 00:57 编辑
    gongqi 发表于 2021-2-13 00:15
    对于epub或mobi,可以调整它们页数的软件试了几个都不太方便,更不太准确。

    现在改用word了。就是把它们 ...

    新年快乐。感谢分享经验。

    这办法可行的话,安卓阅读器(静读天下或者KOreader之类)调整页面属性似乎也行?都不用转换了。
    PDF也还有k2pdfopt之类。Calibre等软件转换epub无法详细控制边距等参数,所以不行。

    ──────────────────────────────
    中文不行,问题太多。注释引用;开本边距;图片和生僻字;字体和特殊符号。哪组都很难解决……





  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-2-13 00:57 | 显示全部楼层
    momo5269 发表于 2021-2-13 00:49
    感谢分享经验。

    这办法可行的话,安卓阅读器(静读天下或者KOreader之类)调整页面属性似乎也行?都不用 ...

    嗯,估计是这样。
    其实,还有个问题,就是这样带页码的目录很难找,尤其是英文的。Amazon里没有,Google book里也没有。中文反而好说,因为jd、当当之类都有。
    哪天遇到中文的也试试。
    新年快乐!
  • TA的每日心情

    2021-2-28 10:27
  • 签到天数: 473 天

    [LV.9]以坛为家II

    发表于 2021-2-13 01:15 | 显示全部楼层
    本帖最后由 momo5269 于 2021-2-13 01:21 编辑
    gongqi 发表于 2021-2-13 00:57
    嗯,估计是这样。
    其实,还有个问题,就是这样带页码的目录很难找,尤其是英文的。Amazon里没有,Google  ...

    同乐!

    中文有些实体和EPUB都有,最后实在不行,只好弄了扫描版……

    ──────────────────────────────
    解释下上面的

    一、注释引用。
      可能是页脚、文末、书尾的方式,或者都有。而EPUB统一为文末。

    二、开本边距。
      开本和版式多样,知道页码也很难确定边距。比如一侧留白颇多的。

    三、图片和生僻字。
      图片大小无法确定,影响段距。生僻字图片尺寸不定,影响行距。

    四、符号和字体。
      1、多种字体字号大小不好确定。见过的英文EPUB和印前PDF一致,少有这个问题。
      2、特殊符号会导致行长度不同。见过不时插两个全角空格的……结果多换好几行。
      3、部分字体会有特定纵横间距,或者有最小尺寸影响间距。不过比较少见。

      这些英文至少有一半不会出现。除了这些还有更过分的的……电子版直接删除特定页面(附属页、合并页面)。当然也还有另类奇葩,电子版就完全是图片扫描版。比如亚马逊的四库相关就有这样的。

      以前新书看得少,用图书馆参**搜结果比较多。后来有新书,不针对全本,只针对章节,用目录页码确定范围,调整之后有些还算准确。但是由于上面的四个原因(尤其是留白)经常出错,最后也就没办法了。只好变成章节第几段落。还好需要插引文的时候极少……


    点评

    忘记说了还有双页码的……多是译作。  发表于 2021-2-13 13:46
  • TA的每日心情
    擦汗
    2021-2-28 11:54
  • 签到天数: 500 天

    [LV.9]以坛为家II

    发表于 2021-2-13 07:11 | 显示全部楼层
    这个一次搞定有点难,只能参考阅读器和原文对照。
  • TA的每日心情
    无聊
    2020-12-30 04:00
  • 签到天数: 404 天

    [LV.9]以坛为家II

     楼主| 发表于 2021-2-13 13:41 | 显示全部楼层
    momo5269 发表于 2021-2-13 01:15
    同乐!

    中文有些实体和EPUB都有,最后实在不行,只好弄了扫描版……

    是的是的。您说的真细,这些问题就是这样。
    所以,也和书的类型有关。插图多了,图的处理就是大问题了。有的epub干脆了删了图。

    英文书好些,但也不是没有问题。我弄的那本可能是赶上问题不大,所以才会每章的首页都对,但也不敢说每页都对,不过对的可能性比较大而已。别的书没找到带页码的目录,甚至第一章的第一页页码是不是1都不知道。自己做笔记就罢了,引用的话还真是有风险。

    Google book也是,号称是录了多少本书,但很多书的电子版就是没有或不对外。

    按章节算的办法我也用过。聊胜于无吧。
  • TA的每日心情
    开心
    2021-2-28 10:41
  • 签到天数: 20 天

    [LV.4]偶尔看看III

    发表于 2021-2-20 09:11 | 显示全部楼层
    国外数据库下载的电子书,比如JSTOR,虽然是文本pdf,但是显现出来与原书基本一模一样,拿来做引文没问题。国内的正版电子书很少有这样的,只看到过很少量的
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条

    小黑屋|手机版|Archiver|国学数典 ( 2006-2020 冀ICP备19008975号-2 )在线客服

    GMT+8, 2021-3-1 05:35

    Powered by Discuz! X3.4

    Copyright © 2001-2020, Tencent Cloud.

    快速回复 返回顶部 返回列表