過去記事で、自炊した本を PDF にしてタブレットで読書していると書いてますが、最近は画像ファイルのままクラウドにおいて、そこで読書するようになりました。
画像ファイルの便利なところは、
・端末に全部ダウンロードしなくても必要なページだけ閲覧できる
・保存が無制限に無料でできる(Google Photoなど一部のサービス)
ところでしょうか。
過去は PDF が扱いやすかったので、多くの自炊本は PDF にしてましたが、もうほとんど PDF は使わないので、順次 PDF を画像に戻してクラウドにあげてます。
■PDFを画像に変換してはいけない
PDF を画像に変換するにはツールが必要です。
VECTOR や 窓の杜 などを検索すると大量に出てきます。
ただ、注意しないといけないのは、
画像が劣化する
ことです。
PDF を画像にしようとすると、PDF を印刷してそれを画像として保存します。つまり不可逆の変換が入ってしまうので、画質は劣化します。
ただ、もともと PDF は画像そのものを取り込んでおり、そこに PDF 処理ができるようなヘッダを付けているだけです。
したがって、PDF から画像を抽出できれば、画像は劣化せずに取り出すことができます。
まあ、実際、変換してみると、不通に読む分にはあまり問題がない程度の劣化です。
「気にしなければいい」だけなのかもしれませんが。
ただ、こうした変換を何度もするとやっぱり気になる劣化が見られます。
たとえば、スキャナで取り込んだとすると
ビットマップ画像 → jpeg 画像
とするときに一度劣化しており、さらに、PDF にするときにも劣化が起きています。
ここに PDF から画像に戻す劣化が加わると、3回の劣化変換が行われていることになります。
見た目大したことがないように変換処理がされていますが、私はこれがどうしても気になるので、
ビットマップ画像 → TIFF画像(可逆圧縮変換)
をしてオリジナルの画像を残してます。
もちろん、デジカメやスマホカメラで撮ったものみたいに、元から jpeg 画像を出してくるものはやむを得ませんが。
■PDFから画像を抽出するツール
そこで、PDF に内包されている画像を抽出するツールを探したほうが、よりきれいな(オリジナルに近い)画像が取り出せます。
探してみたので、いくつかご紹介します。
・Xpdf
・CubePDF ImagePicker
・PDF Image Extractor Free
CubePDF を除き、英語のソフトですが、それほど難しくはありません。
ちょっと、PDF Image Extractor Free の使い方を簡単に。
●PDF Image Extractor Free
・「ImageExtractor.exe」を実行します。
・まず、画面右上にある「Browse」ボタンをクリックし、処理するPDF ファイルを選択
・中段の「Output folder」欄右端にある「Browse」ボタンをクリックし、出力先フォルダを選択
・画面下部の欄で、画像の抽出を行うページを選択
ページの指定方法は、次の中から選べるようになっています。
Extract images on all pages
― 全ページ内の画像を抽出する
Page range
― 範囲指定でページ内にある画像を抽出
Custom pages
― 指定ページ内にある画像を抽出
連続したページを指定する場合は、ハイフンを使う
・下部の「Extract」ボタンをクリック
・「Image files have been successfully saved.」で処理完了