本・花・鳥(ほん・か・どり)

本とか植物とか野鳥とか音楽とか

はじめての検索エンジン設置

様々なHPに自サイト内を検索するフォームが設置されていますが、独自のCGIの他に、Yahoo!やGoogleなどの検索エンジンを使用したものが多いように見受けられます。私が管理している団体サイト(http://jintai-kokkashou.jpn.org/)にはYahoo!の検索フォームを設置していまして、Yahoo!がインデックスした自サイト情報を検索できるので便利ですが、ヘナチョコウェブマスターとしては、企業や自治体のHPのように自力でCGI検索フォームを設置したいとずっと考えておりました。

CGI検索で一番有名なのはNAMAZUhttp://www.namazu.org/)でしょう。あちこちの大手サイトで利用されているフリーの検索プログラムですが、ルート権限がどうだとか、ローカル環境でもperlが必要だとかで、素人には敷居が高すぎてとても手が出せません(汗)。

もう一つの有力候補であるmsearch(http://www.kiteya.net/script/msearch/)は、掲示板などのCGIを設置したことがあれば簡単にインストールできるという触れ込みで相当に魅力的でしたが、検索用のインデックスを作らなければならないということで、これもずっと躊躇気味でした。

超有名なHTML学習サイト「とほほのWW入門http://www.tohoho-web.com/www.htm」ではgrep型のプログラムWWWsearchを配布されています。インデックスを作成しないので簡単そうでしたが、実行のたびに全HTMLファイルを検索するのでサーバーに負荷がかかり、(とほほ内で)反応時間がやや遅いと説明されてはこれにも今イチ踏み切れません。

で、この三種類の代表的検索プログラムの説明サイトを何度も巡回しているうちに、ハタと気づいたことがあるのですが・・・。

私はインデックスを誤解しておりました(汗)。インデックス作成とは、自力で検索キーワードを入力していくことだと勘違いしておりまして、一体何百語を拾い上げなければならないのか戦々恐々としていたのですが、ちょいっとした手続きで、後はプラグラムがやってくれるんですねぇ(笑)。問題があっさり解決したのでとっととmsearchを利用させて頂きました。

本家配布サイトの他にmsearch導入記http://www.kiwi-us.com/~mizusawa/penguin/html_hint/msearch.shtmlというサイトもありまして、設置について事細かに解説してくれていますが、ここに書かれているようにレスポンスが早いこと早いこと。記事内にはインデックスの作成が数十秒とありますが、管理している団体サイトはファイル数が少ないので、ほんの数秒で済みましたし、検索したらあっという間に候補を並べてくれました。

ただ問題は、独自のタグにW3Cがウンと言ってくれないことです。<msearch>タグで囲うとその部分だけインデックスを作成しないので、偽フレームでサイドメニューを付けている団体サイトでは、メニュー部分を検索対象から外して欲しいわけですが・・・。

さて、もう少し調べて、何とかW3Cのバナーが貼れるように頑張ろう(笑)。