Googleスケーラビリティセッションレポート

MicrosoftのDare Obasanjo氏は、GoogleのJeff Dean氏（サイト・英語）がシアトルのスケーラビリティに関する会議で行ったセッション「MapReduce、BigTable、および大規模なデータセットを取り扱うための、その他の分散システムの概念」についての彼の覚書を、ブログの投稿で共有した。Dare氏によると、話はGoogleの大規模でスケーラブルなアーキテクチャの3つの中心的な要素 - 大規模なデータセットを並列に処理することのできる基盤であるGFS(Google File System)（GFSの説明）、MapReduce（MapReduceの説明）、および構造化されたデータのためのGoogleの分散ストアであるBigTable（BigTableの説明） - に及んだ。

レポートはGoogleの基盤に関するいくつかの興味深い詳細を含んでいる。

GFSについて：

現在Googleには200以上のGFSクラスタがあり、そのいくつかは5000以上のマシンを持っている。彼らは現在、クラスタにわたる40ギガバイト/秒以上の読み書きスループットを備えた5ペタバイト規模のストレージによって実行されるGFSクラスタからデータを検索する、何万台ものマシンのプールを持っている。

MapReduceについて：

MapReduceの基盤は、異なるマシンにわたるタスクの並列化および分散化、マシン障害およびデータのエラー状態の取り扱い、I/O帯域幅の消費を減らすために計算をデータの近くに移動するなどの最適化等となっている。システムの監視および数百～数千台のマシンにわたるサービスのスケーラブルを処理するので、開発者は、データセットのために特定のmapとreduceの操作を実行できる、25～50行程度のコードを書くだけでいい。

BigTableについて：

BigTableはリレーショナルデータベースではない。それは結合をサポートしないし、リッチなSQLのような問い合わせもサポートしない。これはむしろ階層的なマップのデータ構造に近い。それはテラバイトのメモリおよび毎秒100万回の読み書きを扱えるペタバイトのストレージ空間を備えた、大規模でフォールトトレラントな自己管理システムだ。BigTableは現在、構造化されたデータの保存と検索のためのプラットフォームとして、60以上のGoogleの製品とプロジェクトで利用されている。

これらの考えを試してみたい人は、MapReduceおよびGFSのような分散ファイルシステムであるHDFS(Hadoop Distributed Filesystem)の実装を含む、Apache Lucene Hadoopサブプロジェクト（サイト・英語）を始めるのが良いかも知れない。

原文はこちらです：http://www.infoq.com/news/2007/06/google-scalability

（原文は2007年6月25日にリリースされました）

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックはエンタープライズアーキテクチャです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Cloudflare社、Rust向けQUICおよびHTTP/3を容易にするtokio-quicheをオープンソース化

Cloudflare社の年次総括：AIボットの過剰クロールと耐量子暗号50％到達、Goが倍増

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

Grab、リアルタイムデータ品質監視をプラットフォームに追加

OpenAIがHarness Engineeringを発表：Codexエージェントが大規模ソフトウェア開発を牽引

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

人工知能によって顧客とのつながりはどう変わるか

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

NVIDIAがAI・ロボティクス・自動運転に跨るオープンモデル・データセット・ツールを公開

DeepSeek-V3.2が推論タスクでGPT-5を上回る

OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム

オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に

AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに

NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco