cles::blog

Solr/ドキュメント/Fess/検索/サーバー

「Fess」 検索アプライアンス並みにすぐ使える検索サーバー
[2009/11/19] (Software)

Solrは検索エンジンの基幹部分としては秀逸で、スケーラビリティやパフォーマンスも高く、土台となっているLuceneをJavaから直接使うよりは格段に使いやすいのですが、機能としてはドキュメントの登録や検索を行うAPIがあるのみです。従ってユーザーが使う事が出来るレベルの検索サーバーとして活用するには、ドキュメントを登録するためのNutchのようなクローラー、もしくは、ドキュメント登録用のバッチや、出力のXMLをユーザーに見やすい形に整形したり、絞り込みのナビゲーションを行ったりするための、ユーザー向けのUIの部分を作り込む必要があり、意外と手間がかかります

本格的に特定の目的のためのサービスを開発するにはそれも仕方ないことなのですが、場合によっては手っ取り早く検索サーバーが導入したいと言う事もあるかと思います。そんなときに第一選択として考えるのがGSAやGoogle Miniのようなアプライアンスになりますが、フリーなものを探しているのであれば、下記の記事で紹介されているFessを検討してみるといいかもしれません

Fessで作るApache Solrベースの全文検索サーバー 〜 導入編(1/3):CodeZine

Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを収集して検索対象とすることができます。

試しにセットアップしてみたら、あっという間にセットアップしてドキュメントのクロールを始める事ができました。
ケータイ向けの機能もあるみたいなので、今後が楽しみなプロダクトです。


コメントをつける
次へ:[6]コクヨの針無しステープラー
前へ:[4]CCCCを利用してメトリクスを計測してみる
[3]最新の記事一覧
Google Apps Scriptで超簡易版RSSリーダーを書いてみた(03/14)
大卒の内定率が氷河期並みに(03/13)
32bit版Windows7で有効活用できないメモリをRAM Diskにしてみた(03/12)
Thunderbirdをトラックポイントでスクロールできるようにする(03/11)
Google Apps Scriptは意外と伏兵かも(03/10)
SQLiteの高速化とトランザクション(03/08)
multitailで複数のログを追いかける(03/07)
エネループがマイナーチェンジしてた(03/06)
長浜ナンバーワン 天神店(03/05)
学会たいま〜 座長の友(03/05)


[0] cles::blog / [2] 上へ / [3] 最新の記事一覧
8536943 (W:5441 Y:4791 T:0650)

hit counter