Solrは検索エンジンの基幹部分としては秀逸で、スケーラビリティやパフォーマンスも高く、土台となっているLuceneをJavaから直接使うよりは格段に使いやすいのですが、機能としてはドキュメントの登録や検索を行うAPIがあるのみです。従ってユーザーが使う事が出来るレベルの検索サーバーとして活用するには、ドキュメントを登録するためのNutchのようなクローラー、もしくは、ドキュメント登録用のバッチや、出力のXMLをユーザーに見やすい形に整形したり、絞り込みのナビゲーションを行ったりするための、ユーザー向けのUIの部分を作り込む必要があり、意外と手間がかかります。
本格的に特定の目的のためのサービスを開発するにはそれも仕方ないことなのですが、場合によっては手っ取り早く検索サーバーが導入したいと言う事もあるかと思います。そんなときに第一選択として考えるのがGSAやGoogle Miniのようなアプライアンスになりますが、フリーなものを探しているのであれば、下記の記事で紹介されているFessを検討してみるといいかもしれません。
Fessで作るApache Solrベースの全文検索サーバー 〜 導入編(1/3):CodeZine
Fessは簡単に導入できる、Javaベースのオープンソース全文検索サーバーです。Fessの検索エンジン部分にはApache Solrを利用しています。Solrは、2億ドキュメントもインデックス可能と言われる非常に高機能な検索エンジンです。一方で、Apache Solrで検索システムを構築しようとする場合、クローラ部分などを自分で実装する必要性があります。Fessではクローラ部分にSeasar Projectから提供されるS2Robotを利用して、ウェブやファイルシステム上の様々な種類のドキュメントを収集して検索対象とすることができます。
試しにセットアップしてみたら、あっという間にセットアップしてドキュメントのクロールを始める事ができました。
ケータイ向けの機能もあるみたいなので、今後が楽しみなプロダクトです。