2020年09月28日

PDFから画像を「抽出」する


過去記事で、自炊した本を PDF にしてタブレットで読書していると書いてますが、最近は画像ファイルのままクラウドにおいて、そこで読書するようになりました。

画像ファイルの便利なところは、

 ・端末に全部ダウンロードしなくても必要なページだけ閲覧できる
 ・保存が無制限に無料でできる(Google Photoなど一部のサービス)

ところでしょうか。

過去は PDF が扱いやすかったので、多くの自炊本は PDF にしてましたが、もうほとんど PDF は使わないので、順次 PDF を画像に戻してクラウドにあげてます。


■PDFを画像に変換してはいけない


PDF を画像に変換するにはツールが必要です。

VECTOR や 窓の杜 などを検索すると大量に出てきます。
ただ、注意しないといけないのは、

 画像が劣化する

ことです。

PDF を画像にしようとすると、PDF を印刷してそれを画像として保存します。つまり不可逆の変換が入ってしまうので、画質は劣化します。

ただ、もともと PDF は画像そのものを取り込んでおり、そこに PDF 処理ができるようなヘッダを付けているだけです。
したがって、PDF から画像を抽出できれば、画像は劣化せずに取り出すことができます。

まあ、実際、変換してみると、不通に読む分にはあまり問題がない程度の劣化です。
気にしなければいい」だけなのかもしれませんが。

ただ、こうした変換を何度もするとやっぱり気になる劣化が見られます。
たとえば、スキャナで取り込んだとすると

 ビットマップ画像 → jpeg 画像

とするときに一度劣化しており、さらに、PDF にするときにも劣化が起きています。
ここに PDF から画像に戻す劣化が加わると、3回の劣化変換が行われていることになります。

見た目大したことがないように変換処理がされていますが、私はこれがどうしても気になるので、

 ビットマップ画像 → TIFF画像(可逆圧縮変換)

をしてオリジナルの画像を残してます。

もちろん、デジカメやスマホカメラで撮ったものみたいに、元から jpeg 画像を出してくるものはやむを得ませんが。


■PDFから画像を抽出するツール


そこで、PDF に内包されている画像を抽出するツールを探したほうが、よりきれいな(オリジナルに近い)画像が取り出せます。

探してみたので、いくつかご紹介します。

 ・Xpdf
 ・CubePDF ImagePicker
 ・PDF Image Extractor Free

CubePDF を除き、英語のソフトですが、それほど難しくはありません。

ちょっと、PDF Image Extractor Free の使い方を簡単に。

●PDF Image Extractor Free
・「ImageExtractor.exe」を実行します。
・まず、画面右上にある「Browse」ボタンをクリックし、処理するPDF ファイルを選択
・中段の「Output folder」欄右端にある「Browse」ボタンをクリックし、出力先フォルダを選択
・画面下部の欄で、画像の抽出を行うページを選択
 ページの指定方法は、次の中から選べるようになっています。
  Extract images on all pages
   ― 全ページ内の画像を抽出する
  Page range
   ― 範囲指定でページ内にある画像を抽出
  Custom pages
   ― 指定ページ内にある画像を抽出
     連続したページを指定する場合は、ハイフンを使う
・下部の「Extract」ボタンをクリック
・「Image files have been successfully saved.」で処理完了

■同じテーマの記事

PDFから画像を「抽出」する

過去記事で、自炊した本を PDF にしてタブレットで読書していると書いてますが、最近は画像ファイルのままクラウドにおいて、そこで読書するようになりました。画像ファイルの便利なところは、・端末に全部ダウンロードしなくても必要なページだけ閲覧できる・保存が無制限に無料でできる(Google Photoなど一部のサービス)ところでしょうか。過去は PDF が扱いやすかったので、多くの自炊本は PDF にしてましたが、もうほとんど PDF は使わないので、順次 PDF を..

わかりやすく書くコツ

「サルでもわかる〜〜」っていうタイトルの本を見かける時があります。「いや、いくらなんでもサルは本が読めないだろ」とは思うのですが、まあ、こういうのって特定のジャンルについて調べようと思うときに「入門書としてはアリかも」という気がして、つい手に取ってしまいます。サルでもわかる福沢諭吉ということで、どうすればわかりやすくなるのかについて完結にまとめられていた本からのご紹介。で..

自炊のコツ

先日、ちょっと思い立って、今どのくらい自炊した本があるかなぁ、と思って数を数えてみました。TIFF形式の本約1200冊PDF形式の本 約 400冊epub,AZW形式約 100冊その他(txtなど) 約 600冊と、なんと約2500冊もありました(お分かりのように全部を自炊したわけではありません)。そりゃぁまぁハードディスクもどんどん買い足さないといけないわけだわ…。しかしながら、読んだ本をかたっぱしから自炊しているわけではありません。ある..

中華タブレットでマルチタスクシステムを構築する

過去記事で何度か書きましたが、現在運用しているPCは7台あります。そのうち2台ほどが、いわゆる「中華タブレット」です。何をさせているかというと、このブログのメルマガの送信やら、記事の更新、ネットから必要な情報のダウンロードなどをさせてます。あとの幾つかの古い PC はちょっと大きなデータの解析用とデータサーバ。マルチタスクシステム以前の記事PCは複数台運用をすると効率が上がるマルチウィンドウで書いたように、1台の高性能 PC よりも、2〜3台の低性能..

面接質問:その課題に対してどのような計画を立てましたか?

面接の質問で、あなたは課題に対してどの様な計画を立てましたか?という設問があります。ウチの会社では昇進の時の申告書にこれを書く欄があります。これに課題:システムの構築10/12 マネジメントレビュー11/13 プロジェクトキックオフ12/03 第1次報告会::04/07 カットオーバーと書いてきたツワモノがいます。私は唖然として、どうコメントするべきかしばらく悩んでしまいました…。計画とは課題に対する工夫とマネジメント別記事..

posted by 管理人 at 16:02| Comment(0) | PCアプリ | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: