InfoQ ホームページ 検索 に関するすべてのコンテンツ
-
DoorDash社、32Mラベルでセマンティック検索のための画像・テキスト・クエリを整列するDashCLIPを構築
DoorDash社は、製品画像、テキスト説明、ユーザークエリを共有表現空間で整列させることによりセマンティック埋め込みを生成するマルチモーダル機械学習システムDashCLIPを発表した。同アーキテクチャは、同社の消費財(CPG)マーケットプレイス全体における商品発見、ランキング、広告関連性の向上を目的とする。システムの学習には、検索クエリと関連カタログ商品を整列させるため、約3,200万件のラベル付きクエリ・商品ペアを用いた。
-
Dropbox社、企業向け知識検索のためのスケーラブルなコンテキストエンジンを構築
Dropbox社のエンジニアは、Dropbox Dashの背後にあるコンテキストエンジンをどのように構築したかを詳述した。そこでは、インデックスベースの検索、ナレッジグラフ由来のコンテキスト、そして継続的評価への移行が示され、企業向けAI知識検索を大規模に支える仕組みが明らかになった。この設計は、企業向けアシスタント全体に広がりつつある傾向を示している。すなわち、チームはライブでのツール利用を意図的に制約し、事前処理され権限を考慮したコンテキストにより強く依存することで、レイテンシを短縮し、品質を向上させ、トークン消費の圧力を軽減しているのである。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
「OpenSearchクラスタのスケーリングでコスト削減へ」QCon San FranciscoでAmitai Stern氏が講演
先日のQCon San Franciscoの講演で、Logz.ioのエンジニアリングマネージャー兼OpenSearchリーダーシップ委員会のメンバーであるAmitai Stern氏は、負荷の変動が激しいワークロード環境でのOpenSearchクラスタ管理の効率化に向けた実用的な洞察を共有した。同氏の講演、"OpenSearch Cluster Topologies for Cost-Saving Autoscaling"では、コストを最小限に抑えたOpenSearchの効果的なスケーリング戦略を検証した。
-
Elasticがオープンソースに回帰:コミュニティはついてくるか?
オープンソースとElasticの両コミュニティにとって驚くべき動きとして、Elasticの創設者兼CEOであるShay Banon氏は最近、ElasticsearchとKibanaを再びオープンソースにすると発表した。この2つの製品は間もなく、OSI承認のライセンスであるAGPLの下でライセンスされる。
-
S3と新しいOR1インスタンスによるAmazon OpenSearch Zero ETL
Amazonは、Amazon OpenSearchサービスのAmazon S3とのゼロ抽出、変換、ローディング(ETL)統合のプレビューを発表した。これにより、サービスを切り替えることなく、Amazon S3およびS3ベースのデータレイクの操作ログを分析する新しい方法が提供される。この開発により、ユーザーはクラウドオブジェクトストアでクエリーの頻度が低いデータをシームレスに調べ、同時にOpenSearchサービスの運用分析と可視化機能を活用できる。
-
Amazon Opensearch Serverless用のベクトルエンジンがプレビュー開始
AWSは、Amazon OpenSearch Serverless内のベクトルストレージと検索機能のプレビューリリースを発表した。この機能は、機械学習によって拡張された検索体験と生成AIアプリケーションをサポートすることを目的としている。
-
AWS、データ取り込みを効率化するAmazon OpenSearch Ingestionを発表
AWSはAmazon OpenSearch Serviceの機能として、Amazon OpenSearch ServiceドメインまたはAmazon OpenSearch Serverlessコレクションにデータを受信、変換、配信するサーバーレス、オートスケール、マネージドデータコレクターを提供するAmazon OpenSearch Ingestionを発表した。
-
Amazon OpenSearchに履歴データの異常検出を追加
Amazon OpenSearch は先ごろ履歴データの異常検出サポートを導入した。この機械学習ベースの機能は、OpenSearch データの傾向、パターン、季節性を特定するのに役立つ。
-
ベクタ類似性検索の実用化を支援するPinecone 2.0
Pineconeは先頃、レコメンデーションシステム、画像検索、および同様のアプリケーションを簡単に開発できるようにする、ベクタ類似性検索(vector similarity search)ソリューションのバージョン2.0をリリースした。創設者でCEOのEdo Liberty氏に話を聞いた。
-
AWSはAmazon Elasticsearch ServiceをAmazon OpenSearch Serviceに名称変更
先頃、AWSはAmazon Elasticsearch Serviceの名称をAmazon OpenSearch Serviceに変更すると発表した。名称の変更に伴い、同社はOpenSearch 1.0をサポートするサービスをリリースし、Amazon Elasticsearch Serviceの後継サービスになった。
-
ElasticSearchをフォークしたOpenSearchが一般提供になった
Amazonは先頃OpenSearch 1.0の一般提供を発表した。これは、ElasticがElasticsearchのライセンスを変更した後に作成されたApache 2.0ライセンスのフォークだ。
-
構造化データと豊富なスニペットによるより良いSEO
Googleの検索デベロッパーアドボケイトであるMartin Splitt氏は、Chrome Developer Summit 2020で、構造化データを使用してウェブサイトをGoogle Searchのリッチな結果に適格にする方法を先頃説明した。リッチな結果はセマンティック検索をサポートし、通常の検索結果から際立たせ、クリック率を高めることができる。
-
Pinterestが階層化ドキュメントを効率的に検索するアーキテクチャについて解説
先日公開されたブログ記事で、Pinterestのエンジニアが、自社開発の検索エンジンで、階層的なドキュメントを取得する効率的な2ステージ検索アーキテクチャを実装した方法について説明している。氏らはこれを、インデックスの平坦化、正規化、非正規化を組み合わせることで実現した。
-
AWSが機械学習を利用したエンタープライズ検索サービスKendraを一般提供でリリース
先頃、AmazonはAWSでのエンタープライズ検索サービスKendraの一般提供を発表した。Amazon KendraのGAリリースにより、いくつかの新しい特別な機能を追加し、サービスの精度を向上させた。