木曜日, 5月 25, 2006

「Lucene入門」

全文検索エンジン「Lucene」の入門書を買ってみた。”ルシーン”と読むらしい。 解析、索引、検索の機能を持ち、検索の対象となる文書をLuceneに渡すことで、それに対して構文解析、索引付けを行い、そこに検索クエリーを実行すると結果リストが返る仕組みのようだ。

というわけで検索対象としたいフォルダを指定すれば勝手にWebページを作ってくれるものではなく、あくまでも解析と索引付けをサポートする位置付けということか。だからWordやExcel、HTMLのドキュメントから必要なテキストを取り出すのは別途コーディングする必要があるらしい。ただこの辺は誰かが作ってそうな気もするな。まあ自分で作ってみるのも面白そうかも。

0 件のコメント: