InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
LinkedInのデータ基盤
LinkedInのJay Kreps氏はどのようにデータを処理しているか、最近のHadoop Summitの発表で詳しく説明した。Kreps氏は、LinkedIn が大量ユーザ/短応答時間でサイトのサービスを提供しながら、1日に1200億もの関連を高速処理し大規模データの計算結果を集計している方法について解説した。
-
データアーキテクチャの台頭 - GigaOm Structure Conferenceのハイライト
2週間前に開催されたGigaOM Stucture conferenceでは、クラウドコンピューティングにおける様々な分野に対する取り組みが行われた。このイベントの主要テーマの一つが、新しいデータアーキテクチャの台頭だった。パネル、インタビュー、プレゼンテーションを通じ、多くのスピーカが、データがどのように扱われるかという点についての来るべき重要な変化について語っていた。
-
NoRM: もうひとつのMongoDB向け.NETプロバイダ
NoRMはMongoDBのラッパーとして動作する.NETライブラリだ。MongoDBに対する.NETプログラムの処理を取り扱う。強い型のインターフェイス、LINQのサポート、NETとMono双方をサポートしているのが特徴だ。
-
Membase,NoSQL ファミリのヘビー級の新メンバ
North Scale Solutions がオープンソースの NoSQL データベース Membase を発表した。Memcached チームのコアメンバが Zynga と NHN の協力を得て開発したこのデータベースは,キャッシングソリューションとして広く利用されている Memcached に対する,プロトコル互換性を持った置き換えだ。
-
Raven, .NET用ドキュメント データベース
Ravenは、大規模なwebアプリケーションに必要なパフォーマンスとスケーラビリティのニーズを解決する非SQL、非リレーショナルなソリューションである。
-
Mahout 0.3: オープンソースの機械学習プロジェクト
クラスタリング、協調フィルタリング そしてカテゴリー化のような機械学習の技術の必要性が、大量の生データを関連する情報に変換するためのアルゴリズムを必要とする、いくつかのソリューションといっしょに、この10年間に、着実に増えてきた。 Apache Mahout 0.3が3月にアナウンスされ、機能性、安定性、パフォーマンスが改善された。
-
MongoDBの躍進: 10genによる1.4のリリースと商用サポート
3月25日にMongoDB("humongous"より)1.4がリリースされた直後、そのクリエータであるDwight Merriman氏(DoubleClickの前CEOおよびCTO)は、10gen(オープンソースのドキュメント・データベースを支援する企業)が、この製品の商用のトレーニングおよびサポートを提供する予定であることを発表した。InfoQはMongoDBについて、またその機能、適用範囲、およびNoSQLデータベースのコミュニティにおける立場についてMerriman氏に話を聞いた。
-
Neo4j: Java ベースの非 SQL グラフデータベース
NeoTechnology が数年にわたって開発を続けてきた Neo4j の バージョン 1.0 がリリースされた。Neo4j は プロパティグラフ (property graph) データモデルを指向する Java ベースの グラフデータベース (graph database) である。InfoQ では NeoTechnology の COO である Peter Neubauer 氏に,今回の Neo4J リリースの詳細と,開発者に提供される内容について話を聞いた。
-
AmazonがMySQLをサービスとして提供
Amazonは新サービスとして、クラウド上にリレーショナルデータベースを作成し、アクセスするためのソリューション、Amazon Relational Database Service(RDS)を発表した。ホストされたデータベースはMySQL 5.1である。発表は、MicrosoftはリレーショナルDBを基盤としたクラウドソリューションSQL Azureが利用可能になることを発表する予定であるPDC 2009を3週間後に控えた時期に行われている。
-
FriendFeed、MySQL上にスキーマレスなストレージを実装
FriendFeedのBret Taylor氏は、急成長するウェブサイトを対象とした「フレキシブルなスキーマでデータを保存し、オンザフライで新しいインデックスを作成する」という課題に対する「スキーマレスソリューション」について語っている。
-
Martin Fowler氏はデータストレージについての凍結した考えがほぐれてきたと考えている
最近投稿したブログ記事の中で、ソフトウェアの思想のリーダーとして有名なMartin Fowler氏は、先日行われたQConで、アプリケーション・アーキテクチャの中でのデータベースに関する固く凍りついた考えがほぐれ始めていることに気づいたと書いている。
-
継続インテグレーションとデータベースのバージョン管理
原則として、データベースに対する作業は必ずバージョン管理しなければならない、と強く主張した記事を投稿した後で、Scott Allen氏はデータベースのバージョン管理を最大限に利用する手法について詳しく述べている。彼は、ベースラインを作成し、スキーマのリビジョン管理に変更スクリプトを使い、データベースの(ビューやストアドプロシージャ、ファンクション、トリガ等の)プログラムされたオブジェクトを管理し、そしてブランチやマージ処理を利用する、包括的で実用的な手法を紹介している。
-
RDBMSでは不十分
リレーショナルデータベースはクライアント/サーバーモデルに適合するものの、サービスの世界では新しいソリューションが必要である。RDBMSはスケーラビリティの問題に陥りやすい。冗長性や並列性をどのようにして実現すればいいのか?