PDFのインデックス作成

複数のPDFを束ねてインデックスを事前に作成しておくことで、フルスキャンを回避して検索を速くする方法。ボクの持ってる Adobe Acrobat 6.0 Professional でもできて、効果抜群! WEB+DB PRESS 総集編 [Vol.1〜36] を買ったらPDXという見慣れないファイルが入っててインデックス作成ができることを知ったんだけど、こんな便利なら早く気づけば良かったよ……。

<

p>たとえば、Adobe Reader 8.0 を使って WEB+DB PRESS 総集編 [Vol.1〜36] のすべてのPDFファイルから「debian」という単語をPDXファイルを使って検索すると16秒で130件見つけてくるが、通常の検索だとなんと2538秒もかかってしまう。HDD性能によって大きく結果は変わるだろうけど、とりあえずボクの環境ではインデックスの効果が実に158倍もあるのだ。インデックスファイルを使用してもクリック一発でPDFファイル内の検索対象単語にリンクされるし、作成時間も数分〜数十分程度しかかからないので、PDFで配布されているWebマガジンやらマニュアルやらには片っ端からインデックスを作成することを勧める。なお、日本語はBi-Gramで索引付けされる。

コメントを残す