Debian勉強会の資料のePUB化を試みた

1,223 views

Published on

Debian勉強会の資料はLaTeXで書かれており、それからPDFを生成し事前配布資料やコミケで頒布している冊子の印刷を行なっています。
eBook Readerで読むにはPDFは向いていないので、ePUB化を試みて分かった課題などを挙げています。

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,223
On SlideShare
0
From Embeds
0
Number of Embeds
25
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Debian勉強会の資料のePUB化を試みた

  1. 1. Debian勉強会の資料のePUB化を試みた まえだこうへい 2013 年 8 月 17 日
  2. 2. eBook使ってます?
  3. 3. ePUB化の動機 when: ePUB フォーマットの書籍購入し始めたころから why: PDF だとフォントサイズの変更でページが自動的にリ サイズされない 1 how: Debian 勉強会の資料の HTML 版を変換すれば楽そう 2 1 特にスマホとか不便 2 http://tokyodebian.alioth.debian.org/html/
  4. 4. 今回ePUB化を試すにあたり Debian 勉強会資料の HTML 化の方法が不明 (一昨日見 つけた) LATEX から直接変換できた方が流れはきれい LATEX → DVI → PDF のどこからでも ePUB 化はできる のではないか?と思って調べてみた
  5. 5. LATEXから ePUB への変換のフロー XML, HTML ePUB 2)-2 LaTeX 2)-a DVI platex 1) 2)-b PDFdvipdfmx 3)
  6. 6. 検証したツールとその結果 パターン ツール名 入力 出力 結果 A3 B4 1) Pandoc5 LATEX ePUB NG OK 1) latex2epub6 LATEX ePUB NG OK 2)-a LATEXML LATEX XML NG OK 2)-b TEX4ht DVI HTML NG NG 2)-b htplatex7(TEX4ht) TEX HTML OK NG 3) Pandoc HTML ePUB OK N/A 4) Calibre PDF ePUB OK OK 3 Debian 勉強会の資料 4 latex2epub のサンプル 5 input/output とも様々なフォーマットに対応した変換ツール 6 武藤さんが作成したツール 7 上川さんが作成した Debian 勉強会の HTML 化スクリプト
  7. 7. 生成されたePUBは? htplatex & Pandoc の場合 表示が崩れる箇所あり tabular が table に変換されず、表にならない 表紙の画像が追加されない TEX4ht で追加されるナビゲートのメニューが残る 夏・冬号が含む月の資料よりも先に変換すると、その 中の画像がコピーされず、pandoc 実行時に失敗する TEX4ht で HTML 変換時に自動生成される画像のファイ ル名が異なり、pandoc 実行時に失敗することがある
  8. 8. 生成されたePUBは? Calibre の場合 目次のレイアウトが崩れる デフォルトでは行間が広すぎる 図が表示されない場合もある tabular が表として表示されない 変換時に次のオプションを入れると多少マシ。 ”ヒューリスティック処理を有効にする” ”外観”→”段落の間の間隔を削除する”
  9. 9. 他のサンプルや他のツールでの検証 pandoc で LATEX を変換した場合 includegraphics が image という文字列になったり、 underline の中が表示されない multicol, newpage, minipage など未対応 dancersection などのマクロ展開できない セクションタイトルが文字化け listing でもコードブロックがうまく表示されず LATEXML は commandline がダメ latex2html は jsarticle は未対応。utf8 にしたら日本語 LATEX でも変換できるが HTML の出力は文字化け (charset が入らないため。エンコード指定すれば表示さ れる) Hermes8 はフォント関連のエラー ePUB reader でも、fbreader なら画像表示されるのに Calibre では表示されなかっ たり 8 http://hermes.roua.org/
  10. 10. htplatex & pandocでの変換用スクリプト $ sudo apt-get install dvi2ps-fontdata-a2n dvi2dvi dvipng pandoc $ htplatex -e debianmeetingresume201308.tex jp,2,sections+ $ ls epub/ debianmeetingresume201308.epub ※ PDF をビルドするときは、dvi2ps-fontdata-a2n をアンイ ンストールしておくこと。
  11. 11. まとめ LATEX を使っていても、 Debian 勉強会とそれ以外では 同じやり方で変換できるわけではない Debian 勉強会の資料を ePUB 化には、htplatex での HTML の編集の調整が必要 TEX4ht コマンド (HChar や HCode を指定している箇 所など) のカスタマイズなど 9 Calibre は GUI & 変換のカスタマイズの自由度が低いの で無理ゲー 最初から PDF および ePUB 生成に対応したドキュメン トジェネレータ (例えば、ReVIEW10 ) に切り替える、と いうのも手段としてはあるけど、どうなんでしょうね。 9 http://osksn2.hep.sci.osaka-u.ac.jp/~naga/ miscellaneous/tex4ht/tex4ht-howtose4.html#x5-150004.3 10 https://github.com/kmuto/review

×