EPUB

Electronic Publication (EPUB)
副档名 .epub
网路媒体型式 application/epub+zip
特征签章 PK 0x03 0x04
开发者 W3C
初始版本 2007年9月
最新版本
3.2
2019年5月15日,​3年前[1]
格式类型 电子书档案格式
专门由 OEBPS Container Format(OCF,ZIP
延伸自 Open eBookXHTMLCSS、DTBook
标准 ISO/IEC TS 30135
自由格式
网站 [email protected]

EPUB(Electronic Publication的缩写,电子出版)是一种电子图书标准,由国际数位出版论坛(IDPF)提出;其中包括3种档案格式标准(档案的副档名为.epub),这个格式已取代了先前的Open eBook开放电子书标准。

概览

EPub是一个自由的开放标准,属于一种可以「自动重新排版」的内容;也就是文字内容可以根据阅读装置的特性,以最适于阅读的方式显示。EPub档案内部使用了XHTML或DTBook(一种由DAISY Consortium提出的XML标准)来展现文字、并以zip压缩格式来包裹档案内容。EPub格式中包含了数位版权管理(DRM)相关功能可供选用。[3]

EPub于2007年9月成为国际数位出版论坛(IDPF)[4]的正式标准,以取代旧的开放Open eBook电子书标准。EPub包括三项主要规格:

  • 开放出版结构(Open Publication Structure,OPS)2.0,以定义内容的版面;
  • 开放包裹格式(Open Packaging Format,OPF)2.0,定义以XML为基础的.epub档案结构;
  • OEBPS容纳格式(OEBPS Container Format,OCF)1.0,将所有相关档案收集至ZIP压缩档案之中。

自 2017 年 1 月 30 日起,IDPF 已与W3C合并。

档案格式

3.2版(当前版本)

3.1版

EPUB 3.0推荐规范发布于2011年10月11日。2014年6月26日,EPUB 3.0.1发布,作为3.0的小维护更新。2017年1月5日发布EPUB 3.1,对文字的格式规范进行了重组和清理。EPUB 3.0取代了之前的EPUB 2.0.1版。可以从IDPF网站页面存档备份,存于网际网路档案馆)找到2.0.1到3.0版本的更新内容。

EPUB 3.0由四个规范组成:[5]

  • EPUB出版物3.0,其定义了出版物级别的语意以及EPUB出版物的首要一致性要求。
  • EPUB内容文件3.0,其定义了用于EPUB出版社中的XHTML、SVG和CSS的设定档。
  • EPUB开放容器格式(OCF)3.0,其定义了将一组相关的资源封装到一个作为EPUB容器的单一档案(ZIP)的档案格式和处理模型。
  • EPUB媒体覆盖3.0,其定义了同步文字和音讯的格式和处理模型。

EPUB 3.0格式旨在解决下列问题:

  • 虽然EPUB能够很好的处理以文字为主的书籍,但其可能不适合那些诸如漫画书的需要精确布局的出版物。[6]虽然这被认为是在解决一个已经解决了的问题,而不是解决悬而未决的问题。[7]
  • 阻碍大多数科技出版物使用EPUB的主要问题是其不支援MathML等式格式。现在,其被作为点阵图SVG图片被嵌入,不能被萤幕阅读器处理,也不能与电脑代数系统互动。EPUB 3.0规范加入了对MathML的支援。
  • 对EPUB规范的其他批评是该规范缺少对链入EPUB书籍、在EPUB书籍之间跳转、在EPUB书籍之内跳转的定义和缺少对注释的定义。对这些连结跳转的阻碍是因为EPUB容器使用的是ZIP档案。此外,目前还不清楚使用EPUB的内部结构标记和直接连结ZIP的档案结构哪个更好。[8]不能以标准方式注释EPUB书籍可能会导致难以共享和转移注释,进而限制了使用EPUB的情景,特别是在教学环境中,其不能提供和网路相媲美的互动性。[9]

2.0.1版

EPUB 2.0发布于2007年10月,2010年9月发布的维护更新版本(2.0.1)对该规范进行了澄清和校正。[10]EPUB 2.0.1版有三个规范组成:

  • 开放出版结构(OPS)2.0.1,包含其内容的格式。[11]
  • 开放包装格式(OPF)2.0.1,使用XML描述.epub档案的结构。[12]
  • 开放容器格式(OCF)2.0.1,以ZIP文件存档所有档案。[13]

EPUB内部使用XHTML或DTBook(数位无障碍资讯系统联盟提供的一种XML标准)表示文字并组织内容文件,使用CSS的子集提供的布局和格式化。XML用于建立文件清单、目录和EPUB元资料。最后,档案被捆绑在一个zip档案之中作为一个包装格式。

开放出版结构2.0.1

EPUB档案使用XHTML 1.1(或DTBook)构建2.0.1版本书籍的内容。这与之前的版本不同(OEBPS 1.2及更早),其使用的是XHTML的子集。然而,在某些元素上存在限制。EPUB中XHTML文件的网际网路媒体类型是application/xhtml+xml。[11]对于所需XHTML模组的列表和限制的描述,可以检视规范的2.2节页面存档备份,存于网际网路档案馆)。

样式和布局使用CSS 2.0的子集,参考开放出版结构样式表。此规范的语法要求阅读系统仅支援一部分CSS属性,并附加了一些自订属性。自订属性包括oeb-page-head、oeb-page-foot和oeb-column-number。可以使用@font-face属性实现嵌入字型,同时在开放包装格式的清单中包含字型档案。EPUB中CSS文件的网际网路媒体类型是text/css。[11]对于支援属性的列表和详细的资讯,可以检视规范的3.0节页面存档备份,存于网际网路档案馆)。

EPUB还要求使用网际网路媒体类型image/png、image/jpeg、image/gif和image/svg+xml支援PNGJPEGGIFSVG图像。规范同样允许其他媒体类型,但创作者必须使用支援的类型提供替代内容。[11]对于所有需要的网际网路媒体类型的列表,可以检视规范的Section 1.3.7节页面存档备份,存于网际网路档案馆)。

必须使用Unicode,内容必须使用UTF-8UTF-16编码。[11]这是为了支援国际化和多语种资料。然而,阅读系统不必提供用于显示所有Unicode字元所需的字型,可以使用至少一个预留位置显示那些不能完全显示的字元。[11]

EPUB的XHTML档案的结构如下:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.1//EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="zh-TW">
  <head>
    <meta http-equiv="Content-Type" content="application/xhtml+xml; charset=utf-8" />
    <title>Pride and Prejudice</title>
    <link rel="stylesheet" href="css/main.css" type="text/css" />
  </head>
  <body>
    ...
  </body>
</html>

开放包装格式2.0.1

开放容器格式2.0.1

数位版权管理

EPUB档案可以随意的作为附加层包含数位版权管理,但这不是规范所要求的。[14]另外,规范没有指定任何特定的数位版权管理系统,所以出版商可以自由地选择适合的数位版权管理计划。然而,未来版本的EPUB(即OCF)可能会指定数位版权管理的格式。[13]

EPUB规范没有强制或推荐使用特定的数位版权管理计划。这可能会影响装置对不同数位版权管理系统所支援的水平以及购买电子书的便捷性。因此,这些数位版权管理的不相容可能会按照数位版权管理系统分裂EPUB格式,这将破坏单一标准格式的优势,使得消费者迷惑。[15][16][17][18][19][20]

目前,拥有数位版权管理的EPUB档案必须在其ZIP容器的根级META-INF目录中包含一个名为rights.xml的档案。[13]

验证

一个名为epubcheck开源工具用于对结构化标记(OPS、OPF、OCF)及XHTML和图片档案进行验证并检查错误。该工具可以从命令列执行,也可以在网路应用程式及应用程式中作为使用。此工具原作中的大部分工作是在Adobe Systems中完成的。[21]

软体

Epub阅读软体

Windows

  • Microsoft Edge:微软为Edge加入支援打开EPUB、PDF 的功能。已终止。[22]
  • SumatraPDF:Windows平台上一款免费阅读器,支援打开PDF, ePub, MOBI, XPS, DjVu, CHM, CBZ和CBR格式。

Linux

macOS

  • iBooks:Apple的电子书阅读工具,支援书面材质、翻页特效、标注、Spotlight、字典功能,能够透过自家iBooks Store下载电子书。

iOS

  • iBooks:Apple的电子书阅读工具,支援书面材质、翻页特效、标注、Spotlight、字典功能,能够透过自家iBooks Store下载电子书。

Android

跨平台

  • FBReader:可在Windows、Linux、macOS、iOS、Android,以及多种PDA上使用的开放原始码阅读软体,支援多种档案格式。
  • calibre:一个自由开源的电子书软体套装,可以用来组织、存放以及管理电子书,支援大多数的电子书格式。同时也支援与许多流行的电子书阅读器进行同步,并可能在数位版权管理的限制下转换电子书的格式。
  • MobipocketPCPDA电子书装置(SymbianWindows MobilePalm OSwebOSJava MEBlackBerry、 Psion、Kindle and iLiad),Mobipocket于2005年被Amazon收购。
  • Google Play图书:使用者可以从Google Play购买和下载电子书,该服务提供超过500万本电子书,Google声称它是全球最大的电子书商店。使用者还可以向他们的Google Play图书帐户云端储存中上传多达1000个PDF或EPUB格式的电子书,并在多个装置之间同步。但不支援上传受到Google Play图书 数字著作权管理(DRM)保护的电子书。

Epub制作软体

  • Sigil:跨平台的开源epub电子书编辑器,支援Windows、Linux和Mac系统。
  • Google文件:Google提供的网页式办公套件在线服务,在档案->下载->EPUB Publication(.epub)之选项。
  • LibreOffice:开放的办公室套装软体,在6.0版中增加「汇出为EPUB」之选项。支援Windows 、 Mac 及 Linux。
  • calibre:一个自由开源跨平台的电子书软体套装,可以用来组织、存放以及管理电子书,支援大多数的电子书格式。同时也支援与许多流行的电子书阅读器进行同步,并可能在数位版权管理的限制下转换电子书的格式。

参考文献

  1. ^ Specifications. IDPF. [2017-03-22]. (原始内容存档于2013-05-06). 
  2. ^ EPUB 101 (PDF). [2011-02-21]. (原始内容 (PDF)存档于2010-12-12). 
  3. ^ IDPF EPub常见问答. [2009-06-11]. (原始内容存档于2009-09-03). 
  4. ^ 国际数位出版论坛(IDPF)首页. [2009-06-11]. (原始内容存档于2010-07-04). 
  5. ^ EPUB 3工作群组. EPUB 3预览草案. IDPF. 2011年10月11日 [2011年10月11日]. (原始内容存档于2012年4月15日). 
  6. ^ Rothman, David. ePub变态测试:处理‘三影堂’图画小时. TeleRead: Bring the E-Books Home. 2008年7月27日 [2013年3月6日]. (原始内容存档于2009年6月26日). 
  7. ^ Fixed Width Layout - A Waste of Time.. [2013-03-06]. (原始内容存档于2012-12-02).  已忽略文字「A Certain Irreverence」 (帮助)
  8. ^ Links, pointers, bookmarks, highlights: How should .epub do it?. FrontMatters. BookGlutton. March 29, 2008 [2013-03-06]. (原始内容存档于2013-08-16). 
  9. ^ Rothman, David. 'Social annotation and the marketplace of ideas': Time for an IDPF annotation standard for books and other e-pubs!. TeleRead: Bring the E-Books Home. November 5, 2007 [2013年3月6日]. (原始内容存档于2013年1月13日). 
  10. ^ 1.1 EPUB Revision History. IDPF. IDPF. 11 October 2011 [2013-03-06]. (原始内容存档于2013-03-06). 
  11. ^ 11.0 11.1 11.2 11.3 11.4 11.5 IDPF. Open Publication Structure (OPS) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-08). 
  12. ^ IDPF. Open Packaging Format (OPF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-25). 
  13. ^ 13.0 13.1 13.2 IDPF. Open Container Format (OCF) 2.0.1 - Recommended Specification. IDPF. September 4, 2010 [February 21, 2011]. (原始内容存档于2013-03-09). 
  14. ^ IDPF. IDPF's Digital Book Standards FAQs. IDPF. November 20, 2006 [2013年3月18日]. (原始内容存档于2009年9月3日). 
  15. ^ Gelles, David. Walls close in on e-book garden. Financial Times. January 29, 2010 [2013-03-18]. (原始内容存档于2013-11-13). 
  16. ^ Rothman, David. Adobe-DRMed ePub isn’t ‘open’: Why the New York Times urgently needs to clarify its Sony eBook Store article. TeleRead: Bring the E-Books Home. August 13, 2009 [2013年3月18日]. (原始内容存档于2009年10月14日). 
  17. ^ Biba, Paul. Does the Nook use its own incompatible DRM scheme?. TeleRead: Bring the E-Books Home. December 21, 2009 [2013年3月18日]. (原始内容存档于2009年12月28日). 
  18. ^ Biba, Paul. iPad adds to the DRM mess? Apple ebook DRM exclusive to Apple hardware. TeleRead: Bring the E-Books Home. January 28, 2010 [2013年3月18日]. (原始内容存档于2010年2月2日). 
  19. ^ Kendrick, James. Who Really Needs an iPad?. jkOnTheRun. January 28, 2010 [2013-03-18]. (原始内容存档于2010-08-05). 
  20. ^ Dave Dickson. EPUB, iPad and Content Interoperability. Digital Editions. January 27, 2010 [2013-03-18]. (原始内容存档于2013-02-20). 
  21. ^ epubcheck: Validation tool for Epub. Google Code. [January 29, 2010]. (原始内容存档于2013-05-09). 
  22. ^ Microsoft Edge 将不再支援使用 .epub 副档名的电子书。. [2020-07-09]. (原始内容存档于2019-09-01). 

外部连结

#