InfoQ

InfoQ

News

マイブックマーク

ブックマークするためにログイン または 会員登録 する

ブックマークされました!

ブックマークがエラーになりました。もう一度お願いします。

RDBMSでは不十分

作者 Sebastien Auvray , 翻訳者 編集部 投稿日 2007年12月6日

セクション
運用/インフラ,
デベロップメント,
設計/アーキテクチャ
トピック
データアクセス ,
Architecture ,
パフォーマンス&スケーラビリティ ,
Ruby
タグ
Relational Databases ,
データベース ,
パフォーマンス&スケーラビリティ
リレーショナルデータベースはクライアント/サーバモデルに適合するものの、サービスの世界では新しいソリューションが必要である(source)。RDBMSはスケーラビリティの問題に陥りやすい。冗長性や並列性をどのようにして実現すればいいのか(source)

(リレーショナルデータベースは)単一故障点となります。特に複製はささいな事ではありません。疑問に思うのであれば、全く同じデータを必要とする2つのデータベースサーバがあることによって起こる問題を考えて見てください。データを読んだり書いたりするために両方のサーバがあると、同時に変更するのが困難になります。マスターサーバとスレーブサーバがあっても、良くありません。なぜなら、マスターはユーザが情報を書き込む際、沢山の熱を帯びるからです。

また、Assaf Arkin氏も整合性を書くこと(source)はRDBMSが自身の重さで内破してしまう理由であると信じている。

参照整合性、制約、アトミック更新などの機能は、クライアント/サーバの世界では非常に重要ですが、サービスの世界では関係ありません。
これらは、ドキュメント指向分散データベースが特に取り組もうとしている典型的な問題である。
MySQLのソフトウェアエンジニアであるDamien Katz氏(サイト・英語)によると、データ管理の柱は以下の4つである(サイト・英語)
  • 保存: データ保存は安全(ACID)、永続的、および効率的であること。
  • 視覚的確認: データは簡単に抽出でき、単純なレポーティング方法を統合し、(フルテキストの)検索を実現すること。
  • セキュリティ保護: データの区画化、SSL接続の実現、データへのユーザ/グループ/ロールの割り当てなど。
  • 共有: オンライン/オフラインにて分散型を採用すること。
Damien氏はCouchDB(サイト・英語)を用いてこれら4つの柱(サイト・英語)を実現している。
CouchDBの定義に当てはまるもの
  • JSON(サイト・英語) REST APIを介してアクセス可能なドキュメントデータベースサーバ。
  • フラットアドレス空間を持ち、アドホックかつスキーマフリー。 
  • 分散型で、双方向のコンフリクト検出/管理機能を備えた頑強な増分レプリケーションが可能。
  • クエリとインデックスが可能で、クエリ言語としてJavaScriptを使用するテーブル指向のレポーティングエンジンを搭載する。
CouchDBの定義に当てはまらないもの
  • リレーショナルデータベース。
  • リレーショナルデータベースに代わるもの。
  • オブジェクト指向データベース。さらに具体的に言うと、CouchDBはOOプログラミング言語向けのシームレスな永続層として機能することを意図していない。

CouchDB、およびドキュメントをデータベースに挿入してからクエリの実行用にビューを定義するという考えに着想を得て、Anthony Eden氏(サイト・英語)は自らドキュメント指向データベースであるRDDB(サイト・英語)を記述し始めた。網羅的なレビュー(source)がすでに入手可能である。

現時点でのRDDBの特徴(サイト・英語)は、以下のとおりである。:

  • ドキュメントが単純に名前/値のペアの集まりである。
  • Rubyコードでビューが定義できる。
  • 低減できるブロックを定義して、ビューから最初のマッピングデータを減らすことができる。
  • ビューを実体化してクエリパフォーマンスを向上できる。
  • データストア/ビューストア/実体化ストアはプラガブルである。現在の実装はRAM、区分編成ファイル/ファイルシステム、およびAmazon S3である。 
  • 分散型の実体化は機能するかもしれないが、書き換えが行われる。
InfoQは、Anthony氏と情報交換し、RDDB、CouchDB、およびRDBMSについて話を聞く機会に恵まれた。

まず、研究プロジェクトを話題にしていたRejectConfにて、RDDBに取り組み始めたきっかけは何ですか?

私はRDDBを個人的な研究プロジェクトであると考えています。ここ数年、分析システムに深く関わり、データウェアハウスなどを開発してきました。また、AmazonのWebサービスも使用してきました。RDDBを使用してこの2つをある時点で統合し、EC2およびS3上で動作する分析データベースが実現できればいいと思っています。これこそ私の第一の目的であり、RDDB作成の背後にあった原動力です。

データ統合という課題にさらされている日々の仕事において、現在ドキュメント指向分散データベースは十分に活用されておらず、今後は導入が進むと思いますか?

まだはっきりしたことは言えません。リレーショナルデータベースの背景には多くの歴史があり、成熟するまで長い時間がかかりました。このため、一方では、リレーショナルデータベースが信頼に値するものとして、運用システムのための明白な選択肢となります。他方では、リレーショナルデータベースは必ずしもすべての種類のデータストレージおよびルックアップに最適な選択肢ではないため、新しいデータストアの機会は存在します。ドキュメント指向データベースがその機会をつかむかはまだ分かりませんが、そうなるかは、スケーラビリティと、パフォーマンスの低下を招くことなく大量のドキュメントを処理できる能力に負うところが大きいと思われます。

サービスモデルの世界でRDBMSの場はまだ存在しますか?参照整合性、アトミックの更新、および制約はクライアント/サーバの世界では価値がありますが、サービスの世界でも妥当でしょうか?

RDBMSは依然として他の判断基準であるため、リレーショナルデータベースがすぐに廃れるものとは思いません。私が思うに、最終的には、事実上一時的であるデータベースが手に入るなら、アトミックの更新の必要性は過去のものとなり、あらゆる種類の更新の必要性をなくすことができるかもしれません。確実に必要なものすべてがリソースに含まれ、リンク切れに対するシステムの耐性が強まった環境に移れば、おそらく参照整合性も必要なくなります。制約は常に役に立つでしょうが、もしかすると、制約のためのロジック定義能力を備え、いっそうリッチになるかもしれません。

RDDBをCouchDBと比較するとどうなりますか?(RDDBもCouchDBもごく初期の段階だとは存じていますが)。CouchDB Rubyバインディングと比べて、RDDBを使用するメリットは何でしょうか?

その2つの質問はまとめて答えることができると思います。CouchDBはErlangで、RDDBはRubyで記述されているため、Ruby開発者にとっては、RDDBの方がずっとハックしやすくなります。CouchDBは分散処理の間、プロセス間通信にErlangの言語機能を使用しますが、一方RubyはRindaやRuby SQSライブラリなどのライブラリに依存します。RDDBにおいて必要なのはRubyGemsを使用してインストールするだけであるため、Ruby開発者にとって、RDDBを立ち上げて実行するコストはCouchDBの場合よりも大幅に少なくなります。RDDBにおけるビューはRubyで記述されますが、CouchDBのビューはJSONで記述されています(少なくとも現在のところ)。現時点では、RDDBの方がドキュメントストア、ビューストア、および実体化ストア(これらすべてがRAM、ファイルシステム、S3ストレージをサポートします)向けに異なる実装を備え、プラガブルだと思います。また、RDDBは実体化向けの異なる実装(ローカル、Rinda、EC2など)とともに、スレッド化/非スレッド化実体側も備えています。

InfoQではしばらく前にActiveWarehouse(source)についての記事を記載しましたが、そのプロジェクトの進み具合はいかがですか?ActiveWarehouseはエンタープライズ内で使用されていますか?

最近、ActiveWarehouseの周辺は静かです。作業と利用のほとんどは、ActiveWarehouse ETLライブラリを備えたETL側だと思います。私の目的は、近い将来にActiveWarehouse ETLのバージョン1.0をリリースすることです。Railsプラグインに関しては、バージョン1.0へのアップグレードが実現するには、ディスプレイ側へのさらなる取り組みが明らかに必要です。一部の人はユーザインターフェースコードの変更に関心を示しており、今後どうなるか見ていてください。

原文はこちらです:http://www.infoq.com/news/2007/11/the-rdbms-is-not-enough

特集コンテンツ一覧

GAE開発の落とし穴

Googleのクラウド環境をつかったGoogle App Engineによる開発するにあたり、初めての試みで苦悩する開発者達の経験をもとに、各開発フェーズにあわせて問題点やどう解決したかをご紹介します

イベントレポート:「Coqチュートリアル#1」

去る1月12日、定理証明支援系ツールCoqの初心者向けチュートリアルが開催さ れた(http://kokucheese.com/event/index/23667/)。今後も2月2日 (http://kokucheese.com/event/index/23744/)、2月9日、2月16日と引き続き開 催されていく予定である。本記事では、開催の様子をレポートする。

Javaの未来についてのNeal Gafter氏とのディスカッション

Choosing Options

Neal Gafter氏はOracleによるJava買収の影響に関する議論、Javaにセグメンテッドスタックやメタオブジェクトプロトコルを追加することについての主張、そしてJavaとC#との比較について話をしてくれた。

Google Dartのエッセンス:アプリケーションの構築、スナップショット、Isolate

GoogleはVMをともなう新しい言語であり、JSコンパイラでもあるDartをプレビューした。 InfoQはDartのアプリの構築に貢献する文法の裏側を探った:スナップショット、Isolate、モジュール方式

CSPベースのモデル検査ツール「Process Analysis Toolkit」

本記事ではCSPベースの「マルチドメイン・モデル検査ツール」である、PAT(Process Analysis Toolkit)について紹介する。モデル検査は、形式手法(Formal Method)という方法論を基礎とする技術であり、複雑さが増大しながらも安全性を求められる、現在のソフトウェア開発の状況に対する処方箋の1つとして注目されている手法である。

Jenkinsによる継続的インテグレーションのススメ(4) ~CloudBeesでJenkinsをサービスとして使う~

前回まで、Jenkinsの幾つかの側面に注目して解説をしてきました。シリーズ最後の今回は、Jenkinsをサービスとして使う方法を紹介します。

書籍『抽象によるソフトウェア設計-Alloyではじめる形式手法-』の紹介

Alloyは、MITにて開発された仕様記述言語であり、ツールによる自動解析を使い、インクリメンタルに形式仕様が書けることが特長である。筆者らはAlloy開発者による、Alloyを使った形式手法入門書を翻訳、今夏にオーム社より刊行した。本記事では、Alloyの簡単な概要と、翻訳書『抽象によるソフトウェア設計』(「Alloy本」)を紹介する。

Windows デバイスで開発するタッチユーザーインターフェイス

スマートフォンを中心としたマルチデバイスにおけるタッチユーザーインターフェイスへの対応は、既に必須の項目となりつつある。本記事では、Windows デバイスにおける UX のベースとなっている「メトロ」というデザイン言語を掘り下げながら、既存環境を意識しつつもどのようにタッチユーザーインターフェイス開発に取り組んでいくべきであるかについて解説していく。