人気コンテンツ今日: |
SolarisにXpdfをインストールSubmitted by sasaki on 月曜, 2009-03-23 13:56.
PDFファイルからテストを抽出するpdftotextコマンドを利用したいので、Xpdfをインストールした。
■Xpdfのソースをダウンロードするhttp://www.foolabs.com/xpdf/download.html ftp://ftp.foolabs.com/pub/xpdf
ダウンロードするファイル freetype-2.3.1.tar.bz2 (xpdfで必要) t1lib-5.1.0.tar.gz (xpdfで必要) xpdf-3.02.tar.gz xpdf-japanese-2004-jul-27.tar.gz (日本語対応のため必要)
■freetypeをインストールする$ bunzip2 freetype-2.3.1.tar.bz2
docs/UPGRADE.UNIX に書いてあったコマンドを試してみた。 $ freetype-config --prefix Solaris 10 は、以下の場所にインストールされていることが分かったので、freetypeはインストールしなかった。 /usr/sfw/bin/freetype-config /usr/sfw/lib/libfreetype.so /usr/sfw/include/freetype2/freetype/
■t1libをインストールする$ tar zxvf t1lib-5.1.0.tar.gz /usr/local/lib/libt1.so などのライブラリがインストールされた。 /usr/local/share/t1lib/t1lib.config 設定 /usr/local/share/t1lib/doc/t1lib_doc.pdf ドキュメント
■xpdfをインストールする$ tar zxvf xpdf-3.02.tar.gz
/usr/local/bin/xpdf /usr/local/bin/pdftotext /usr/local/bin/pdfimages 等がインストールされた。
■日本語対応させる$ tar zxvf xpdf-japanese-2004-jul-27.tar.gz
■pdftotextコマンドでPDFからテキストを抽出するPDFファイルからテキストを抽出する。 $ pdftotext -enc Shift-JIS test.pdf test.txt というファイルが同じディレクトリに作成される。(はず)
エラーメッセージが表示された。 Error: Unknown character collection 'Adobe-Japan1'
pdftotext -h でヘルプを見ると、設定ファイルの指定方法が書いてあったので試した。 $ pdftotext -cfg /usr/local/etc/xpdfrc -enc Shift-JIS test.pdf Shift_JIS ではなく、Shift-JIS で指定する。指定方法は、/usr/local/etc/xpdfrc を見れば分かる。
■参考ページ
|
Solarisamazon広告英語お勧め教材! 英語の学校でも使っているのですが、1つのストーリーを3分で読めて、内容も面白く、もっと早く出会いたかった本です。 Apple好きで英語も勉強したいならこの一冊! ブログパーツ |