BT

Apache LuceneおよびLucene.Net – 全文検索サーバ

| 作者: Jonathan Allen フォローする 530 人のフォロワー , 翻訳者 編集部 フォローする 0 人のフォロワー 投稿日 2008年11月14日. 推定読書時間: 1 分 |

10年前オープンソースプロジェクトに依存することは、ほとんどのWindows事業所では考えられないことだった。最近になって、.NETプログラマが Javaプラットフォームで立証され開発された、エンタープライズクラスソフトウェアの世界に目覚めている。ここで、全文検索エンジンである、Apache LuceneおよびLucene.Netを検討する。

Apache Lucene(リンク)とそのポートであるLucene.Net(リンク)は、 歴戦の製品であり、Wikipedia、CNETおよびMonster.comなどの有名なサイト(リンク)へ検索機能を提供するために使用されている。そうした理由から、それらの機能や未来は確かなものである。

Luceneは、巡回検索エンジンではないし、自動的にコンテンツを索引付けしない。索引付けされるドキュメントのテキストは、Luceneインデックスにロードされる前に抽出される必要がある。これをおこなう標準的なパターンは、Analyzerをインスタンス化し、IndexWriterをオープンし、1つづつ各ドキュメントを追加する。それが済むと、インデックスはクローズされ、変更がコミットされる前に、任意的に最適化される。おそらくこのプロセスは、デベロッパが慣れている以上に実践的であり、索引付けされるデータの柔軟性を提供する。

オブジェクトモデルを通じ、検索は実行される。代わりに、エンドユーザによって入力されるプレーンテキスト検索ストリングを解析し、実行することができる。.NET 3.5以降を使用した.NETデベロッパには、LINQ to Luceneという3つ目の選択肢もある。プロジェクトページは、Luceneの検索構文および対応するLINQ to Lucene(リンク)構文間のすばらしいマップがある。

試してみたいなら、Andrew Smith氏がIntroduction to Lucene.NET(リンク)を提供しているので、参考にするとよい。.NETやJavaバージョンを選ぼうが、Erik Hatcher氏のLucene Intro(リンク)も参考にするとよい。

 

原文はこちらです:http://www.infoq.com/news/2008/11/Lucene

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT