SQL Server 2011の列ベースのストレージ

原文(投稿日：2011/03/08)へのリンク

ほとんどの主要なデータベースと同じように、SQL Serverはクラスタインデックスを持っているときは、テーブルをB木で保持する。それ以外の場合はヒープを使う。この2つの方法は行に基づいて行われる。この場合、ページ当たりの行数は行全体のサイズに依存する。しかし、SQL Server 2011からはもう一つの選択肢が利用できる。“カラムストアインデックス”を利用することで、SQL Serverは行の代わりに列を元にデータを保存する。

Microsoftの発表では、14億4千万の行を保持する1TBのテーブルを利用するとき、列指向の問い合わせを実行すると、CPU時間で16倍のスピード改善と455倍もの経過時間の改善が見られたということだ。実質的には501秒かかっていた問い合わせが1.1秒までに改善するということだ。このテストは256GBのメモリと32の論理プロセッサを持ったマシンで実施された。

この劇的な改善は各列をそれぞれのページに分離することで実現されている。問い合わせが実行されると結果セットの列だけがディスクからロードされる。対象以外の列が含まれるページは単に無視される。

あらゆる列の組み合わせのカバリングインデックスを保持することと似ている。しかし、この方法だとハードディスクを大量に利用する必要はない。容量は従来のテーブルよりも少なくて済む。SQL Serverのデータ圧縮はページレベルで発生する。また、行よりも列の方がデータが重複している可能性が高い。したがって、カラムストアインデックスを使ったテーブルは高い圧縮率が期待できる。

しかし、カラムストアインデックスを使うかどうかは簡単に決定できない。何よりもまず更新ができない。一度カラムストアインデックスを作成すると、テーブルに対して追加、更新、削除ができなくなる。Microsoftは、毎日の更新作業や読み取り専用データで利用されることをが想定している。更新作業ではインデックスをドロップし、データを更新して、インデックスを再作成するという使い方になる。これは大変な作業になるので、データの変動を論理テーブルの一部分の中だけに抑えるため垂直のパーティショニングをすることもできる。

また、カラムストアインデックスを使うことで性能が劣化する可能性もある。ほとんどの列を扱うような問い合わせをすると行の再結合に膨大な時間がかかるからだ。つまり、OLTPのような問い合わせはOLTPであるがゆえに利用に適さない。言い換えれば、“SELECT *”やひとつの行のすべての値を一度に取り出すような問い合わせをしているなら利用には適さない。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは Microsoft です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Cloudflare社、Rust向けQUICおよびHTTP/3を容易にするtokio-quicheをオープンソース化

Cloudflare社の年次総括：AIボットの過剰クロールと耐量子暗号50％到達、Goが倍増

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

Grab、リアルタイムデータ品質監視をプラットフォームに追加

OpenAIがHarness Engineeringを発表：Codexエージェントが大規模ソフトウェア開発を牽引

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開

DeepSeek-V3.2が推論タスクでGPT-5を上回る

OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム

Google Cloudは、130,000ノードのGKEクラスターを用いてKubernetesの大規模スケールを実証

オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に

AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに

Online InfoQ Architect Certification

QCon AI Boston

QCon San Francisco