LinkedIn、リードオンリーキーバリュー型ストアのPalDBをオープンソース化

原文(投稿日：2015/10/27)へのリンク

LinkedInhが組み込み可能なリードオンリー・キーバリュー型ストア、PalDBをオープンソース化した。PalDBはLevelDBよりも8倍高速で、HashSetよりも数倍消費メモリが小さいという。

PalDBはJavaで書かれたライトワンス・キーバリュー型ストアで、LinkedInによってオープンソース化された。ストアを作成した後、すべての操作はリードオンリーだ。目的は、リード操作の改善とより小さなメモリフットプリントにある。LinkedInが推奨している用途は、サイドデータ（side data）の格納だ。彼らはサイドデータのことを「目的を果たすためプロセスが必要としている追加のリードオンリーデータ」と定義している。「自然言語処理アルゴリズムが使うストップワードのリストは、サイドデータの一例です。」

PalDBは組み込み可能で、スキーマを使わずに、データをバイナリファイルに保持する。そして、API経由のランダムデータアクセスを提供する。

PalDBはリード操作に最適化されており、LinkedInによると、そのパフォーマンスはHashMapやHashSetのような他のインメモリデータ構造に匹敵しつつ、使用メモリを大幅に削減しているという。これがLinkedInがPalDBの設計時に求めていた、大きなメリットの一つだ。例えば、100MのキーHashSetには500MB以上が必要になるが、PalDBであれば約80MBだけで済む。また、35MのメンバーIDにはHashSetで1.8GBのRAMが必要になるが、PalDBでは290MBしか必要としない。PalDBはフットプリントをより小さくするため、Snappyを使ってデータを圧縮する。

スピードに関して、LinkedInが実施したテストによると、PalDBは毎秒2Mリード、HashSetの6倍高速で、LevelDBやRocksDBの8倍高速だという。（MacBook Pro 3.1 GHz及び10Mのキーインデックスを使用）。

PalDBはメモリアクセスに最適化されている。データがディスクに保持されていると、パフォーマンスは大幅に低下するだろう。データサイズに制限はないが、インデックスのサイズには2GBの制限がある。PalDBはスレッドセーフでないことも知っておくべき重要なことだ。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco