書籍の電子化に関する体験談
    2013/4/8 金子弘樹
話すこと

•   ある本のPDFを元にEPUBブックを作成した体
    験談

•   はじめて自炊代行サービスを利用した感想

•   EPUB作成ツールの未成熟に驚く

•   右綴じ、縦書きEPUBの設定方法
「自炊」のはじまり
•   書籍をスキャナーで読み込み電子化する方法
    を、通称「自炊」という

•   両面を一度に読めるドキュメントスキャナー
    の普及などが後押し

•   裁断機で本を裁断し、1枚ずつ読み込む

    •   個人が書籍を裁断、1枚ずつスキャン?面倒
        だ!そこで業者に頼むことにした
「自炊」代行サービスの勃興


• 印刷所?などが自社の機器を活かし、
 書籍のスキャニングサービスを始める

• 1冊100円から、業者も多数あり
• しかしスキャンした本は捨ててしまう
 →著作権への配慮と思われる
自炊と著作権
•   テレビ番組の録画と同じく、書籍電子化は
    「個人の私的複製」となる筈

•   自炊代行業者は「個人」ではないので「個人
    の私的複製」に当てはまらない?

•   法律が時代について行けていない

•   「「自炊」代行、著作権使用料徴収で許諾検
    討」(2013年3月26日06時19分 読売新聞)
本を返却する業者

•   スキャンした本を返してくれる業者もある

•   ポリシーを持って営業しているようだが著作
    権的にはグレーゾーンの部分もある

•   260ページ、400dpi、OCR付き、裁断済み本の
    糊付け込みで3500円だった

•   基本250P 800円+オプション
PDFからEPUBへ
•   自炊代行業者はスキャンした本をPDF形式に変換後、
    OCRで検索可能なPDFにもできる

•   日本語、特に縦書き、更に二段組の本はOCRの精度が低
    い

•   OCRで9割ほど認識した後に手動で修正するのがよい

•   PDFから抽出したテキストを元にEPUB化できれば電子本
    ストアで販売できる
EPUBとは
•   EPUB(イーパブ)は、電子書籍の規格の1つであ
    る。米国の電子書籍の標準化団体の1つである国際
    電子出版フォーラム (International Digital Publishing
    Forum, IDPF) が普及促進している公開された仕様の
    電子書籍用ファイル・フォーマット規格である。

•   Wikipediaより。
    http://ja.wikipedia.org/wiki/EPUB
EPUBの仕組み
•   各章を構成するxhtmlと見た目を定義するcssをzipで
    固めただけ

•   Apple iBooksは著作権保護機能などを独自に追加
    (EPUB非標準)

•   まるで黎明期のHTMLを勉強しているようだ

•   タグ手打ちで本の作成は面倒。優秀なツールの登場
    が望まれる
EPUB作成ツール(1)
•   Mac OS X

    •   Apple Pages(1700円)

        •   現状EPUB 2.0のみ対応

    •   Apple iBooks Author(無料)

        •   電子教科書作りに特化。長文には向かず

    •   Adobe InDesign(料金まちまち)

        •   プロ用ツール。業者さんはどうぞ
EPUB作成ツール(2)
•   Windows

    •   ジャストシステム 一太郎 2013 玄(16800円∼)

        •   EPUB 3.0の縦書きにも対応

•   マルチプラットフォーム(Mac, Linux, Windows)

    •   Sigil(無料。寄付歓迎)

    •   上記いづれかのアプリで作成した後にタグを修
        正する場合、有効
EPUB 日本語独自の問題

•   縦書き

    •   EPUB3.0で縦書きに対応するも、Pagesで非対応

•   ルビ

    •   HTMLと同じく<ruby>タグで対応しているらしい
        が今回は使わず

•   右綴じ

    •   content.opfファイルの設定で対応可能(後述)
今回のワークフロー
1. 紙の本をテキスト付きPDFにしてもらう(業
 者に頼む)

2. PDFからテキスト、画像を抽出

3. Apple Pagesで編集、EPUB出力

4. Sigilで開き直しタグを修正する(縦書き化)
縦書き、右綴じに修正する場合(1)


・Style0001.cssを修正
body {

    epub-writing-mode:vertical-rl;

    -webkit-writing-mode:vertical-rl;

}

 →縦書き、右綴じの意
縦書き、右綴じに修正する場合(2)


・各章を構成するxhtmlにcssを読み込む
旨、明示的に指定
<head>

  <link href="../Styles/book.css" rel="stylesheet"
type="text/css" />

</head>
縦書き、右綴じに修正する場合(3)


・content.opf

<package xmlns="http://www.idpf.org/2007/opf"
unique-identifier="BookId" version="3.0" xml:lang="ja">

 →version属性値を3.0に変更、xml:lang="ja"属性追加

<spine page-progression-direction="rtl" toc="ncx">

 →page-progression-direction属性追加

  ページ開きは右から左(Right To Left)の意
まとめ
•   自炊は面倒なので代行サービスを利用していきたい

•   「自炊代行」を著作権法違反とするのは時代遅れ(著作権
    料二重取りしたいだけ)

•   自炊は過渡期の技術。原稿自体がが電子データなら自炊も
    要らない

•   EPUB、特に日本語特有の問題に関してはツールが未成熟

•   これから大手電子本ストアに公開するところまで体験して
    みたい

Making EPUB in Japanese

  • 1.
  • 2.
    話すこと • ある本のPDFを元にEPUBブックを作成した体 験談 • はじめて自炊代行サービスを利用した感想 • EPUB作成ツールの未成熟に驚く • 右綴じ、縦書きEPUBの設定方法
  • 3.
    「自炊」のはじまり • 書籍をスキャナーで読み込み電子化する方法 を、通称「自炊」という • 両面を一度に読めるドキュメントスキャナー の普及などが後押し • 裁断機で本を裁断し、1枚ずつ読み込む • 個人が書籍を裁断、1枚ずつスキャン?面倒 だ!そこで業者に頼むことにした
  • 4.
    「自炊」代行サービスの勃興 • 印刷所?などが自社の機器を活かし、 書籍のスキャニングサービスを始める •1冊100円から、業者も多数あり • しかしスキャンした本は捨ててしまう →著作権への配慮と思われる
  • 5.
    自炊と著作権 • テレビ番組の録画と同じく、書籍電子化は 「個人の私的複製」となる筈 • 自炊代行業者は「個人」ではないので「個人 の私的複製」に当てはまらない? • 法律が時代について行けていない • 「「自炊」代行、著作権使用料徴収で許諾検 討」(2013年3月26日06時19分 読売新聞)
  • 6.
    本を返却する業者 • スキャンした本を返してくれる業者もある • ポリシーを持って営業しているようだが著作 権的にはグレーゾーンの部分もある • 260ページ、400dpi、OCR付き、裁断済み本の 糊付け込みで3500円だった • 基本250P 800円+オプション
  • 7.
    PDFからEPUBへ • 自炊代行業者はスキャンした本をPDF形式に変換後、 OCRで検索可能なPDFにもできる • 日本語、特に縦書き、更に二段組の本はOCRの精度が低 い • OCRで9割ほど認識した後に手動で修正するのがよい • PDFから抽出したテキストを元にEPUB化できれば電子本 ストアで販売できる
  • 8.
    EPUBとは • EPUB(イーパブ)は、電子書籍の規格の1つであ る。米国の電子書籍の標準化団体の1つである国際 電子出版フォーラム (International Digital Publishing Forum, IDPF) が普及促進している公開された仕様の 電子書籍用ファイル・フォーマット規格である。 • Wikipediaより。 http://ja.wikipedia.org/wiki/EPUB
  • 9.
    EPUBの仕組み • 各章を構成するxhtmlと見た目を定義するcssをzipで 固めただけ • Apple iBooksは著作権保護機能などを独自に追加 (EPUB非標準) • まるで黎明期のHTMLを勉強しているようだ • タグ手打ちで本の作成は面倒。優秀なツールの登場 が望まれる
  • 10.
    EPUB作成ツール(1) • Mac OS X • Apple Pages(1700円) • 現状EPUB 2.0のみ対応 • Apple iBooks Author(無料) • 電子教科書作りに特化。長文には向かず • Adobe InDesign(料金まちまち) • プロ用ツール。業者さんはどうぞ
  • 11.
    EPUB作成ツール(2) • Windows • ジャストシステム 一太郎 2013 玄(16800円∼) • EPUB 3.0の縦書きにも対応 • マルチプラットフォーム(Mac, Linux, Windows) • Sigil(無料。寄付歓迎) • 上記いづれかのアプリで作成した後にタグを修 正する場合、有効
  • 12.
    EPUB 日本語独自の問題 • 縦書き • EPUB3.0で縦書きに対応するも、Pagesで非対応 • ルビ • HTMLと同じく<ruby>タグで対応しているらしい が今回は使わず • 右綴じ • content.opfファイルの設定で対応可能(後述)
  • 13.
    今回のワークフロー 1. 紙の本をテキスト付きPDFにしてもらう(業 者に頼む) 2.PDFからテキスト、画像を抽出 3. Apple Pagesで編集、EPUB出力 4. Sigilで開き直しタグを修正する(縦書き化)
  • 14.
    縦書き、右綴じに修正する場合(1) ・Style0001.cssを修正 body { epub-writing-mode:vertical-rl; -webkit-writing-mode:vertical-rl; }  →縦書き、右綴じの意
  • 15.
  • 16.
    縦書き、右綴じに修正する場合(3) ・content.opf <package xmlns="http://www.idpf.org/2007/opf" unique-identifier="BookId" version="3.0"xml:lang="ja">  →version属性値を3.0に変更、xml:lang="ja"属性追加 <spine page-progression-direction="rtl" toc="ncx">  →page-progression-direction属性追加   ページ開きは右から左(Right To Left)の意
  • 17.
    まとめ • 自炊は面倒なので代行サービスを利用していきたい • 「自炊代行」を著作権法違反とするのは時代遅れ(著作権 料二重取りしたいだけ) • 自炊は過渡期の技術。原稿自体がが電子データなら自炊も 要らない • EPUB、特に日本語特有の問題に関してはツールが未成熟 • これから大手電子本ストアに公開するところまで体験して みたい