How to make the e-books


[戻る]





■ 電子書籍の作り方 (ePUB3)







 ● 総目次


          INDEX




■ 趣意


電子書籍(以下:電書)に関しては、筆者は、90年代から、実作者の立場で関わってきた。

もとより、マーケット(市場)としての電書の頒布に、実作者として関心を持つのは当然であるが、それ以前に、巨大な流通産業やそのショッピングモール、または、国内外の非営利的なコンソーシアムなどを通さずに、作家個人が手作りで電書を作れないものか、という試みに、ずっと考えを馳せてきたのだ。

日本語の特殊な性質や属性、また、その出版界の特殊性などから、わが国における電書の作成と頒布は、困難な道のりがあった。作成はともかく、頒布の点では、いかにして課金するか、というアポリアがあり、「電子書籍元年」といった「かけ声」は何回となく聞いたが、出版界の因循姑息かつ旧態依然の体質から、いずれも、かけ声だけに終わって、空しい気持ちだけが残った。

だが、最近になって、状況が変わり、個々の物書きが、たった一人で電書を作成し、頒布する、それによって妥当な対価を得ることが可能になった。

以下は、そうした時代にそって、物書きの視点を外れて、読み手サイドから、電書の作り方を略記することにした。
物書きサイドからのアプローチも、続けてはいるが、そちらは非常に困難な道のりがあり、Kindleによって道が開けたとはいえ、まだまだクリアすべきアポリアが多すぎて、今の間に合わない。さしあたり、いち読者として、電書に関わる(筆者も、自作を離れれば、読者であることに変わりはないので)。そういう立場でのノウハウを、記しておくのが、本稿の目的である。

大きく分けて、電書のコンテンツは、テキストか画像か、という区分がある。
前者は、大まかに云うと、小説やエッセーその他、活字で読む本をデジタル化したものであり、後者は、マンガに代表される画像データをデジタル化したものだ。 だが、近頃、その法的な妥当性が問われている「自炊」によって、本来、テキストベースであるべき活字の本が、スキャンデータとして画像として処理され、後者に属したりするので、画然と区別はできない。

いずれにせよ、作り手の手許に、元データがある、ということが前提である。
この場合、元データというのは、著作権法上、クリーンなものを指す。違法な方法で入手されたテキストや、画像データは、それを個人の利用であっても、電書化するのは控えてもらいたい。それが、一応、物書きでもある筆者のスタンスである。

さて、上記のように、区分した以上――、

1)テキストデータ
2)画像データ

という2つのデータごとに分けて話を進めるべきだが、以下に略記する方法は、同一のフリーウェアを使っており、テキストであれ、画像であれ、元データを用意すれば、そのソフトによって電書化が可能である。

ソフトの名は「ChainLP」という。
Web上で公開されており、無償で使える。あいにくWindows版しかないので、Macユーザの方はプラットフォームフリーの「sigil」(Win、Mac、UNIXに対応)などを利用されたい。本稿では「ChainLP」での作例しか記さない。不悪。
また、ChainLPでは、元データがテキストであれ、画像であれ、そうしたインプットの段階で区別しないだけではなく、アウトプット、すなわち電書化する出力先のフォーマットも多種多様な形式(PDF、cbz、Mobi等)が用意されている。

ここでは、もっとも汎用性の高い「ePUB3」に出力することを前提にする。

「ePUB」は国際規格で、規格がver.3になってから、(それまで不可能だった)日本語の縦書きやルビ・圏点などに対応するようになった。
ePUB3規格で作成された電書は、さまざまなデバイスで読むことが出来る。パソコン(Windows でもMacでも)はもとより、iPad、iPhone、ソニー・リーダー、kobo touch、Kindle Fire 等々。あまたの機器で可読な規格であり、日本語化も進んでいる(Kindleでは、正確にはePUB3は可読ではなく、それを一度変換する必要がある)。

2012年半ばまでは、海外製のデバイスを無理矢理にカスタマイズし、フォントの埋め込みを行い、そこで日本語版のテキストを読ませる、といった方法しかなかったのだが、現在は違う。ePUB3対応のデバイスなら、フォント埋め込みでないファイルも可読である。

元データとなるテキストや画像データさえあれば、誰でもePUB=電書が作れるし、手近かで安価なデバイスによって、それを読むことが出来るようになったのだ。
具体的には、2012年、楽天が発売したkobo touch、2013年、Amazon が発売したKindle PaperWhiteやKindle Fireなどで、日本語のテキストが日本語のフォントで、縦書き、ルビや圏点付きで読めるようになっている。それ以前は、PDFを除けば、縦書きもルビも未対応であった。PDFは自由にフォントの大きさを変更できない等、電書としては使い勝手が悪い欠点があり、それを考えると、大きな進歩である。
しかも、いずれも、先行するデバイスより安価で求めやすい。7吋の大きさ(正味の画面は6吋)も、ちょっとした新書やノベルス版に近く、iPadでは大きすぎる、というユーザの意向にも合致している。9.7吋のiPadは(たぶん外人でさえ)片手では操作できないだろうが、koboやKindleなら、日本人の女性でも片手で持ち、もう一方の手で操作可能である。

筆者は、昨年(2012年)夏以来、koboを入手して、数ヶ月、いじくり倒して、それに最適化した電書を作る作業を試行錯誤してきた。
その後、Kindle PWも購入し、操作性や視認性の向上に目を見張ったが、自作ファイルの披見には、koboの方が向いている。
ちなみに、koboは公式には、ePUBとPDFにしか対応していない。だが、やろうと思えばテキストをHTML文書にする(といっても文書の上下にタグを付す)だけで、電書として読むことが出来る。ただし横書きである。
ここはやはり縦書きで読みたいものだ。

結果から云うと、テキストでも画像データでも、ePUBが一番、可読性(リーダビリティ)が高く、汎用性がある。
PDFは、7吋の電書リーダには不向きである。ePUBなら、テキストの場合、フォントの大きさも自由に変えられるし、それによって画面上の体裁は崩れるが、テキストだけなら、別段、レイアウトなどに留意する必要はないので、問題ない。また、画像データを元にした場合でも、ほぼコミックスの大きさに近く、やはりePUBの方が可読性が高いと判断した。

だから、以下に述べることも、いかにして、読み手の手許にある元データを、デジタル化し、電書化するか、という方法論に限定して、規格は「ePUB3」に統一したい。PDFや、他の規格=フォーマットは、ここでは論じない。
念のために付言すると、自炊などで作成したPDFをChainLPを介することでkoboなどの7吋リーダに最適化し、補正することは可能である(このサイトなどを参照)。
だが、ここでは、あくまでもePUB3フォーマットだけを論じる。
この点、あらかじめ、ご了解ねがいたい。

このページのトップに戻る


■ ChainLP


「ChainLP」は、以下の制作者のサイトから無償でダウンロードできる。フリーソフトである。

http://no722.cocolog-nifty.com/blog/chainlp/

サイトは、下図のように、制作者の美学か、全体にモノトーンで統一され、シンプルである。
少々、素っ気ない気もするが、必要十分なことは記されており、ChainLPについては、ソフトに同梱されたヘルプファイルがあるので問題はない。
かなり頻繁に開発され、サイトも更新されている。2014年10月02日時点での最新ヴァージョンは、「v0.40-16」となっている。

ChainLP


起動させると、次のようなメイン画面が現れる。

ChainLP


右端上の入力項目に「dir」「arc」「txt」とあるのは、それぞれ、「ディレクトリ」「アーカイヴ」「テキスト」の略で、連番のファイルなどは「dir」から、補正作業などのPDFは「アーカイヴ」から、テキストファイルなら「txt」から入力する。

同じく、出力項目に、「LDF」「PDF」「dir」「cbz」「ePUB」「Mobi」とある。
これらは、ソニーリーダ用の「BBeb」(=拡張子「.LRF」)、「PDF(補正)」、「連番ファイル」「ComicBookZIP」(=拡張子「.CBZ」)、「ePUB」、「Mobipocket」(=拡張子「.MOBI」)と豊富で、リーダに合わせた出力が可能になっている。
もし、2013年以降、ChainLPがヴァージョンアップすれば、koboやKindle Fireなどに対応する可能性はあるだろう。
だが、今のままでも十分である。

上述したサイトから「ChainLP40b12.zip」を落としたら、解凍し、そのまま使える(セットアップやインストールの手間は不要)。

ただし、WindowsXPまでのユーザならよいが、Windows7以後のユーザは、少し気をつける必要がある。
Windows7や8では、特定のフォルダへの制約(UAC=User Account Control(ユーザアカウント制御))が厳しく、アプリを登録するProgram Filesやシステム関係のフォルダは、事実上、一般ユーザが扱うことが出来ないからだ。
だから、「ChainLP」も、Program Filesとは別なフォルダを作成して、そこに解凍する。筆者は「C:\Works」というフォルダを作って、その下に「ChainLP」を格納している。こうした任意のフォルダ名の中なら、Win7以後の厳しいUACの制約も及ばないから、ファイルの入出力も簡単にできる。留意されたい。
特に、このようなフリーウェアの場合は、どこから起動しても、さして不都合はないので、この方法を推奨する(というより、他に手はない)。UACをオフにする方法もあるが、MS社とて何も考えずにこうした制約を課しているわけではないので、他への影響を考えるとUACのオフは推奨しかねる。
特に問題がなければ、別名フォルダ内で作業することがよいと思われる。ただ、Windowsユーザで、(マイ)ドキュメントでの作業に慣れた人などは、こうしたフォルダのツリー構造がよく判らないかも知れないので、あらかじめ自分が作成したフォルダのフルパス(絶対パスとも云うが、この場合、「C:\Works\ChainLP\」といったルート直下から末端までのパス)を念頭においておかれたし。

さて、「ChainLP」を使うには、いくつか事前にやっておくべき「前処理」がある。

まず、「ChainLP」は、配布サイトにも明記されているように、「Microsoft.NET framework 4.0というランタイム・ライブラリが前もってインストールされている必要」がある。 このページは面倒くさいので、以下のサイトから落とすといいだろう。

http://www.microsoft.com/ja-jp/download/details.aspx?id=17851

さらに、配布サイトにあるよう、「ePubを作成するために、zip32j.dll+zip32.dllを使用して」いるので、この2つのダイナミックリンクが必要となる。これはZIP圧縮用のファイルである。
さらに、もし手許の元データが、ZIP以外の、たとえばLHAやRARなどで圧縮されていた場合は、UNLHA32.dllやUNRAR32.dllなどが必要となる。

通常は、サイトにも記された「http://www.csdinc.co.jp/archiver/lib/zip32j.html」ページから落とせばよい。
これは有志が運営している「統合アーカイヴ・プロジェクト」という、ZIPなど、アーカイバ=圧縮技術全般のdllファイル、その他を扱っているサイトである。

いずれにせよ、この2つのファイル(zip32j.dllとzip32.dll)は必須である。
Windowsは、XPあたりから、ZIP圧縮されたアーカイヴファイルの解凍にサポートしているが、独自仕様なので、汎用性がなく、暗号化などもできない(また、XP時代は、解凍のみで圧縮はできなかった)。汎用性を求めると、上記のdllファイルが必要となる。
「dll」(=ダイナミックリンクライブラリ)ファイルは、適切な場所に置かないと、機能しない。適切な場所とは、専門的にいえば、「パスが通っている場所」を指す。
だが、この用語自体、初心者には判りにくい、というより、Windowsユーザには意味不明だと思うので、ここでのくわしい説明は省く。

具体的には、WindowsXPやVistaまでは、元ファイルを解凍し、dllファイルを、「C:\Windows\System32\」フォルダ直下にコピーすればよかったのだが、先述したように、Windows7から、そうしたフォルダへのアクセスが厳しく制限されているので、事実上、該当フォルダにdllファイルをコピーするのは不可能に近い。
だから、他に使わないなら、直接、「ChainLP」を解凍したフォルダ内に放り込んでおけばOKである。

「MS.NET framework」の方はともかく、後者の2つのdllファイルは、「ePUB」が、複数のファイルを圧縮し、1つのファイルにするためのものである。つまりePUBとは、拡張子が「.epub」のZIP技術を応用した圧縮ファイルなのだ(実質、ePUBとはZIPファイルであり、拡張子を変えれば、ZIPファイルとなる)。
最近のMS Office のdocxファイルなどが同じ仕組みであるが、圧縮よりは、むしろ複数のファイルやフォルダを1個に束ねるのが主目的のようだ。

試しに、ePUBファイルをアーカイヴ・ユーティリティソフト(WinRARなど)で直視すると、以下のような構造になっているのが判る。
端的にいえば、xmlとZIP技術を駆使した、統合ファイルである。

[Title]
  |_Content _indexP00001.xhtml
  |  | |_indexP00002.xhtml〜
  |  |
  |  |_Resources_index0.css
  |       | _P00001.jpg
  |       | _P00002.jpg〜
  |
  |_Meta-INF_container.xml
  |
  |__iTunesArtwork
  |__metadata.odf
  |__mimetype
  |__toc.ncx

しかし、まぁ、このような知識は、それを使うユーザサイドにとっては、理解しておくことにしくはない程度のことである。
知っておいて損にはならないが、知らないでも使える。それでいいと思う。MS Office のdocxファイルだって、原理など知らなくても、Wordは使える。同じことだろう。

さて、前処理が終わったら、「ChainLP」を起動してみる。
この手のフリーソフトは、インストーラが付属していない。解凍しても、デスクトップにアイコンなど作成されないので、起動も、自分の手作業でやるしかない。

何度も使うフリーソフトの起動方法で、一番、簡単なのは、解凍したフォルダ内の「ChainLP.exe」という実行ファイルの「ショートカットキー」をデスクトップに作ることだろう。
実行ファイル「ChainLP.exe」を右クリックして、コンテキストメニューから「ショートカットの作成」を選ぶ。「ChainLP - ショートカット.lnk」というファイルが作成されるので、それをデスクトップにドラッグすればよい。
なお、ChainLP40b12.zipを解凍すると、「BatchLP.exe」という似た名称の実行ファイルも展開されるが、これは関係ないので、間違えないように。
(これは、上部メニュー「ツール」内にある「青空バッチ」など、バッチ処理によって、複数のファイルを一気に処理するための実行ファイルだが、初心者は使わないだろうから、ここでは、説明も省く)

ChainLPでは、デフォルトで入出力フォルダが決められていない。
逆に、自分で自由に決められる、とも云える。筆者はChainLPフォルダ直下に、「sagyo」「output」の2つのサブフォルダを作って、元データを「sagyo」に容れ、出力ファイルを「output」に格納するようにしている。
むろん、どんな名前でも構わない。前者を「input」でもOKである。自分で判りやすい名前であり、かつ作業中に別のサブフォルダと間違えたりしない名前のフォルダにすることが肝要であろう。

とりあえず、先にサブフォルダを作っておいた方が作業がやりやすい(というか、あらかじめ作っておかないと、そのまま作成作業に入ると、途中で新規フォルダを作成する工程がないので、作業が中断されてしまう)。
下図で、「出力フォルダ固定」に、次のようにフォルダを指定する。

ChainLP


右端の参照ボタンからディレクトリをたどり、「出力フォルダを指定してください」画面で、上述の「output」フォルダを指定する。「保存」ボタンを押下し、元の画面で、チェックを入れれば、以後、すべてのePUBファイルは作成されると、このフォルダに格納される。

ChainLP


筆者は、Cドライブの下に、「x_soft」というサブフォルダを作り、小物のフリーソフトなどを、そこにまとめて容れている。「ChainLP」は、その下に作成したサブフォルダであり、さらに、「output」は、「ChainLP」下に作成したサブフォルダである。
図式すると以下のようになる。

C---x_soft
   |_ChainLP
   |  |_sagyo
   |  |_output
   |_ChainLP.exe〜

多少、面倒に感じるかも知れないが、多くのWindowsユーザは、Documents(旧My Documents)=表示上「ドキュメント」というフォルダに、いろんなファイルを放り込みすぎの気がする。MS社が、デフォルトで決めているから、自然とそうするというのでは、あまりに主体性に欠けるし、どだい、利便性に問題があると思われる。
HDDが論理クラッシュするのは、大体、Cドライブだから、「システム」と同じドライブのドキュメントフォルダに「データ」を蓄積するのは、保安面から見ても愚直にすぎる。
ドキュメントごとDドライブに移す方法もあるが、それだったらDドライブをデータ専用にして、そちらを区分した方が早い。デスクトップ上にドキュメントのショートカットがあるから、という理由だけで、MSの言いなりにデフォルトで使うのは、どうかと思う(ショートカットなら自分で作ったフォルダでも作れる)。

ただ、システムはCドライブ、データはDドライブと、単純に分けるのも難がある。
後でファイルを整理する手間を考えると、こうした特殊な用途のファイルはまとめて、作成した場所にサブフォルダを作るか、使う場所に作るかして、置いておいた方がよいと思う。作った時は憶えていても、しばらく使わないと忘れてしまう懸念がある。そのつど、ファイル検索するのもバカげている。用途に近い場所(その実行ファイルのあるフォルダの直下など)にあれば、後から見ても、すぐにそれと判る。
電書ファイルは、電書リーダに格納して初めて使い物になる。PC内のそれは、データ転送して以後は、単なるバックアップだ。ならば、一時預かり所のようなフォルダが相応しいだろう。無造作にドキュメントフォルダにまとめて容れておく必要はない。
これ以上は、本稿の趣旨から外れるから打鍵しないが、とにかくシステムとデータは原則、別にする。ただし、特殊なデータは、用途別に近い場所におくのが望ましい、というのが筆者の方針である。

なお、付言すると――、
たまたま、このフリーソフトは、インストールという手間がないからいいが、もしインストールする方式の場合、うっかりProgram Files のフォルダ下に容れてしまうと、前述したように、必要なdllファイルをそこに転送(コピー)することも出来なくなる。
もちろん、たとえ、インストール時に、その直下に「出力フォルダ」が作成されるような方式になっていても、Windows7では、そのフォルダからファイルを取り出せない。旧XP時代のソフトを、Windows7以後で使う際は、要注意である。
そうした不便さを回避するためにも、筆者の方法のほうがいいように思われる。

むろん、違う考え方のユーザもいるだろうから、その場合は、この「固定フォルダ」をMy Documentsなり、Documentsにしても構わない。
PCユーザは使う人の数だけ使い方があって当然なので、それは自由だろう。ただ、筆者は、自分のPCでは、そういう「標準的とされる使い方」をしていないので、ご面倒だが、以下の記述も、適宜、読み替えて、読んでもらいたい。

さて、以下は、条件ごとに異なるページで説明したい。

1)電子書籍の作り方 テキスト(小説)>ePUB3
2)電子書籍の作り方 コミック>ePUB3

さらに――、

3)kobo touch での電子書籍リーディング

各々のページにリンクしているので、好む項目を選んでもらいたい。
なお、HTML文書作成の手順で、先に画像データ(コミック)から始めた。
よって、事前処理などの詳細は、そちらで詳述している。一応、テキストを第2ページにしているが、便宜的な区分である。面倒だが、テキストから始める人でも、まず、画像データ処理の電子書籍の作り方 コミック>ePUB3 の前半から読んでもらいたい。

さらに、これは後から付記したページだが、その後に発売された「Kobo glo」やAmazon の「Kindle PaperWhite」などは、画面の解像度が異なるため、「kobo touch」に特化した以下の記述では、画面解像度やフォントの数値などが違ってくる。
そのために、kobo glo と KindlePaperWhite での解像度の違い というページを新設した。詳細は、そちらで述べる。

このページのトップに戻る




△ Literacy  ▲General Index
      Next >>




Last Updated: 2014.11.15


inserted by FC2 system