www検索エンジンNamazuの設置

www検索エンジンの設置

  目的
自分のサイトに検索エンジンを設置する。比較的ポピュラーなNamazuを使用する。

完成図
(スクリーンショット準備中)

1. インデックスを作成する
あらかじめ、wgetを使って、ホームページの内容を~/web/www.avant-tokyo.comというディレクトリに保存してある。
これから作るインデックスのwww.avant-tokyo.comという保存先ディレクトリに移動する。
ホームページの内容を保存してあるディレクトリを指定してmknmzを実行する。

$ cd ~/index/www.avant-tokyo.com
$ mknmz ~/web/www.avant-tokyo.com/

インデックスを保存するディレクトリを指定するときは、-Oオプション(オー)を使う。これで、どこのディレクトリにいても上と同じ結果を得られる。

$ mknmz -0 ~/index/www.avant-tokyo.com ~/web/www.avant-tokyo.com

2. ファイルの削除
ヘンなとこにインデックスファイルを作ってしまったら、NMZから始まるたくさんのファイルを消さなきゃいけないんだけど、このコマンドでさくっと消してしまおう。筆者はよく失敗するので(^^;;

$ rm -f NMZ*

3. 検索してみよう
先ほど作ったインデックス(NMZ.*)を使って検索してみる。インデックスファイルがあるディレクトリに移動して、namazuコマンドを実行して「WebObjects」という言葉で検索してみた。

インデックスの作られたディレクトリに移動する

$ cd ~/index/www.avant-tokyo.com

インデックスを見てみよう。これらがインデックスだ。

$ ls
NMZ.body NMZ.field.summary NMZ.r
NMZ.body.ja NMZ.field.summary.i NMZ.result.normal
NMZ.err NMZ.field.to NMZ.result.normal.ja
NMZ.field.date NMZ.field.to.i NMZ.result.short
NMZ.field.date.i NMZ.field.uri NMZ.result.short.ja
NMZ.field.from NMZ.field.uri.i NMZ.slog
NMZ.field.from.i NMZ.foot NMZ.status
NMZ.field.message-id NMZ.foot.ja NMZ.t
NMZ.field.message-id.i NMZ.head NMZ.tips
NMZ.field.newsgroups NMZ.head.ja NMZ.tips.ja
NMZ.field.newsgroups.i NMZ.i NMZ.version
NMZ.field.size NMZ.ii NMZ.w
NMZ.field.size.i NMZ.log NMZ.wi
NMZ.field.subject NMZ.p
NMZ.field.subject.i NMZ.pi

早速、WebObjectsという言葉を検索してみよう。

$ namazu WebObjects

これで、検索結果が表示されるはずだ。

4. Webで検索できるようにしよう
前準備として、cgi-binにnamazu.cgiを設置する。

(制作途中です)