LinuxコマンドでPDFファイルを画像に変換する(pdftoppm)
Linuxコマンド(pdftoppmコマンド)でPDFファイルをページごとに画像に変換することができます。ページ指定や解像度も指定できたり、トリミングもできるという強力なコマンドです。
前回はPythonでPDFファイルから画像ファイルに変換する方法を書きましたが、なんてことはない、それがLinuxコマンドでできたとは…。
基本形
基本形は下記のとおりです。出力ファイルにページ番号を付記して出力してくれます。-pngを-jpegにするとJPEGファイルで出力されます。
pdftoppm -png PDFファイル名 出力ファイル名(拡張子なし)
例は以下の通り。カレントディレクト内のPDFファイルすべてをimage-ページ番号.pngというファイル名で出力されます。
pdftoppm -png *.pdf image
ご覧の通り、PDFファイルがPNG画像ファイルに出力されました。
ページ番号を指定する
-r ページ番号
で開始ページ、-l ページ番号
で終了ページを指定できます。
以下の例は5ページ目から10ページ目までを画像にしてくれます。
pdftoppm -f 5 -l 10 -png *.pdf image
解像度を指定する
-r DPI値
で解像度を指定できます。デフォルトは150です。
以下の例はDPI=100の解像度で出力してくれます。
pdftoppm -r 100 -png *.pdf image
モノクロで変換する
-mono
オプションを使うことでモノクロで出力してくれます。
pdftoppm -mono -png aaaa.pdf image
ただ、これはあまりおすすめできません。なぜか画質が極端に悪化します。特に文字が入っているものは避けたほうが良いでしょう。
それ以外にもトリミングなど多彩なオプションが用意されています。上記以外は個人的にあまり使わないようなものなのでここでは割愛します。
スポンサーリンク