BT

Cassandra 1.0.0.は企業向けに準備万端

| 作者: Abel Avram フォローする 10 人のフォロワー , 翻訳者 徳武 聡 フォローする 0 人のフォロワー 投稿日 2011年10月25日. 推定読書時間: 2 分 |

原文(投稿日:2011/10/21)へのリンク

ApacheはCassandra 1.0.0を発表した。データ圧縮といくつもの性能改善と最適化が行われたこの分散列指向データストアは初の大きなマイルストーンに達した。

CassandraはApacheのオープンソースプロジェクトであり、AmazonのDynamoやGoogleのBigTableのような列指向ベースデータモデルの基礎にある分散的な性質の上に構築されたスケーラブルなデータベースマネジメントシステムだ。Cassandraは最初、Facebookによって開発されていたが2008年にオープンソースになり、それから開発され続けている。Apacheは最近、最初の大きなマイルストーンであるCassandra 1.0.0を発表した。これは多くの機能追加やバグ修正がされている。

期待されていた機能のひとつは圧縮だ。ColumnFamily単位でのCassandra 1.0はデータ圧縮をサポートする。ColumnFamilyは従来のリレーショナルDBのテーブルと同じような列のコンテナだ。圧縮のプロセスはバックグランドで走り、ノードの応答時間が劣化することはない。圧縮することでデータ量が2分の1から4分の1になる。結果、Pavel Yaskevich氏によれば読み取りで間接的に25-35%の性能改善、書き込みで5-10%の性能改善があった。

Apache CassandraプロジェクトのVPであるJonathan Ellis氏によればCassandra 0.6から1.0からで大きく改善されたのは性能だ。“2010年のリリースと現在のリリースを比べると、書き込みの性能は40%も改善しました。しかし、改善に注力したのは読み込みの性能です。結果、驚くべきことに400%も改善しました。”

他の改善点は、

オフヒープキャッシュやアリーナアロケーション、自動自己チューニングによるメモリ管理の改善。GCでの停止を抑制し、性能が予測可能になった(詳細)。

ディスクスペース管理の改善。コミットログで使われるスペースの制御の改善と使われていないデータファイルの即時削除。

より性能が予測しやすく、固定のSStableサイズの新しいコンパクション方式(詳細)。

Hinted Handoffの改善。読み取りリペアの必要性を抑制して読み取りの性能を改善した。

多くの性能改善(詳細)、CQL、リペア、より簡易な運用など。

Cassandraは現在、Cisco、DiggFacebookRackspaceRedditTwitterなどで使われている。最大のクラスタでは100TBのデータを持ち、150マシンの上で動作している。

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT