Lucene 2.2：ペイロード、Functionクエリ、さらなるスピード

Lucene Java(サイト・英語) 2.2が発売中(source)である。Luceneは100％Javaで書かれた高性能、フル機能のテキスト検索エンジンである。今回のリリースでは次のようないくつかの新機能が盛り込まれた。

Payloads機能：任意のバイナリデータをインデックスのどの項目にも関連付けることができる
関数クエリ：ドキュメントのスコアの算出方法についてより制御することができる（Solrから組み込まれた）
NFS経由での「ある時点をとらえる（"Point-in-time）」検索：NFSにスナップショットのような機能を提供
新たなPre-analyzed Field API：ダミーのアナライザーコードなしでDocumentのPre-analyzed Fieldを扱える
Maven(サイト・英語)での一般リリース：すべてのLuceneモジュールの最新リリースが、Mavenレポジトリを介して入手可能

InfoQは、Luceneプロジェクトのコミッターであり、プロジェクト管理委員会（PMC）のメンバー(source)であるGrant Ingersoll氏(source)にインタビューし、今回のリリースについて詳細を尋ねた。インタビューの中で、Ingersoll氏は、自分の見解・意見はあくまで個人のものであり、Lucene PMCの公式見解ではないことを明確にするようInfoQに要請してきた。

InfoQは、Luceneの2.2リリースでより短い四半期ごとのリリースサイクルへと変わったと確認した。Ingersoll氏によると、このようにリリースの頻度が上がったことで、バグ修正および新機能がより迅速にコミュニティに提供できるといった、いくつかの利点があるとのことである。またリリースのプロセスもMavenのサポートが向上したことで合理化されており、今後のリリースはMavenユーザーにより早く提供されるようである。

InfoQはIngersoll氏に、Payloads機能について尋ねたところ、次のような答えが返ってきた。

Payloadsという新機能により、項目ごとにインデックスにある情報を保管することができます。例えば、Webページにインデックスをつける場合、関連URLまたはテキスト解析に基づいた重み係数などの追加情報を格納すると有益である場合があります。より高度なアプリケーションの場合、あるスピーチの中で名詞が他の部分よりも重要だとしてスコア付けするため、ある言葉のスピーチを格納すると有益であることもあります。今年ApacheCon Europeで行った私の講演(PDFファイル・英語）で使ったPayloadsのスライドの中に、関連する部分が載っています。

さらにIngersoll氏は、またSolrから始まった新しいFunctionクエリについて、次のように説明した。

新しい検索関数パッケージ(org.apache.lucene.search.function (source)) により、開発者はドキュメントをスコア付けするのにフィールドの実際のコンテンツを使うことができます。例えば、あるドキュメント内のフィールドに緯度・経度情報を格納していれば、これらのフィールド内の情報を使ってドキュメントのランク付けに影響を及ぼすことができます。つまり、Starbucksの検索をしている場合、検索結果においてユーザーに近い場所にある店舗をより遠方の店舗よりも高くランク付けすることができるのです。他には、価格または利幅の情報を使ってランク付けに影響を及ぼす（つまり皆さんの会社にとってより大きな利幅を持つ製品を高くスコア付けする）といった例もあります。倫理的に私がこれに賛同していると言っているわけではなく、こういうことができるということです。）

次にLuceneの次のリリースでユーザーは何を期待できるかという質問に対し、Ingersoll氏は、Michael McCandless氏が主導している新しいメモリ管理技術(source)のおかげでインデックス作成のパフォーマンスに著しい改善が見られるとしている。また同氏は、Luceneの最新リリースでは多数のパフォーマンス強化が見られ、ユーザーは自身でそれを試してみたくなるだろうと述べている。最後にIngersoll氏はJava 5のサポートおよびインデックス作成プロセスにおけるより高い柔軟性が、Luceneの今後のリリースで見られる可能性があると語った。

今回のリリースに盛り込まれたすべてのバグ修正、機能、最適化を列挙した完全なchangelog(txtファイル)が入手可能である。Luceneの前回までのリリースと同様、2.2はLuceneの前回までのバージョンからインデックスを読み込み、インポートすることが可能である。ただしインデックスが変換されてしまったら、Luceneの前のバージョン（例：2.1）でもう読み込むことはできないが。

原文はこちらです：http://www.infoq.com/news/2007/07/lucene22

（原文は2007年7月6日にリリースされました）

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは検索です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

GitHub社、Free、Pro、およびPro+ユーザーからのCopilotインタラクションデータを、AIモデルのトレーニングに使用する方針

23年間潜伏していたリモート悪用可能なLinuxカーネル脆弱性の発見にClaude Codeが使われた

AI搭載ボットがGitHub Actionsワークフローを侵害、Microsoft、DataDog、CNCFプロジェクトにわたり

Cloudflare社、AIエージェント向けにトークン使用量を最適化するCode Mode対応MCPサーバーを発表

AnthropicがManaged Agentsを発表、AIエージェントのデプロイをシンプルに

DoorDash社、32Mラベルでセマンティック検索のための画像・テキスト・クエリを整列するDashCLIPを構築

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

MySQL 9.6で外部キー制約とカスケード処理が変更

Anthropicの論文がLLMでの感情様メカニズムの行動影響を検証

AnthropicがエージェントベースCode Reviewを導入、Claude Code向け

Platform Engineering Labs社、formaeをマルチクラウド対応に拡張

オープンソースセキュリティツールTrivyがサプライチェーン攻撃被害、業界に緊急対応迫る

Google Cloudは、130,000ノードのGKEクラスターを用いてKubernetesの大規模スケールを実証

Online InfoQ Architect Certification

Online InfoQ Organizational Architect Certification

Online InfoQ AI Engineering Certification

QCon San Francisco

QCon London 2027