InfoQ ホームページ Distributed_Systems に関するすべてのコンテンツ
-
Cascading 2.5がHadoop 2をサポート
今週リリースされたCascadingの新バージョンにはHadoop 2のサポートとCascading Lingualが含まれている。Cascading Lingualは,Hadoopベースのデータにアクセスする手段として包括的なANSI SQLインターフェースを提供する,オープンソースのプロジェクトだ。
-
YARNで強化されたHadoop
Hadoop 2が利用可能になった。このバージョンでYARNが導入され、Hadoop上でデータ処理アプリケーションを動かせるようになった。私たちはHortonworksのプロダクトマネージャであるRohit Bakhshi氏にYARNについて、そしてYARNがHadoopユーザにとってどのような意味を持つか、話を聞いた。
-
Amazon EMRのベストプラクティス
Best Practices for Amazon EMRというホワイトペーパーで、Parviz DeyhimはAWS EMRのベストプラクティスを説明している。データの移行やデータの収集、圧縮、集約の方法やAmazon EMRの構成の一般的なアーキテクチャパターンを説明している。
-
ConcurrentがHadoop向け機械学習DSLのPatternをリリース
企業向け大規模データアプリケーションプラットフォーム事業者であるConcurrent, Incが業界標準に準拠するPMMLを利用した機械学習DSLであるPatternを発表した。SAS, R, Microstrategy, Oracleのような分析フレームワークはPMML形式でモデルを出力し、Hadoopクラスタで実行できる。
-
MicrosoftがリアルタイムNode.jsアプリケーションをスケールアウト可能にするモジュールを提供
Microsoftは新たなオープンソースでの貢献として、Windows Azureサービスバスを利用したリアルタイムNode.jsアプリケーションに対するスケールアウトサポートの提供を開始した。このモジュールはsocket.io-servicebusと呼ばれ、人気のSocket.IOモジュールを実行している複数のサーバをつなぐものである。この貢献は、MicrosoftのNode.jsへの傾倒とMicrosoftの製品やサービスへの統合を示すさらなる一例となっている。
-
Windows Azureが更新し、Hadoop, HTML5/JS, CORS, PhoneGap, Mercurial、Dropboxをサポート
最近リリースされたWindows Azureのアップデートは、Hadoop サービス, HTML5/JS, CORS, PhoneGapをサポートし、Mercurial, Dropbox, CodePlex、Bitbucketのデプロイが統合されている。
-
Cassandra, Hadoop, Solrのセキュリティを強化するDataStax
先週、Cassandra、Hadoop、Solrを使っているクラスタ環境のセキュリティ関連機能を備えたDataStax Enterprise (DSE) 3.0が発表された。InfoQはDataStaxの製品担当バイスプレジデントのRobin Schumacher氏に話を聞いた。
-
ConcurrentがHadoop用SQL DSLをリリース
Concurrent, Inc.企業ビッグデータアプリケーションプラットフォームの会社が今日、Lingualを発表した。これはオープンソースプロジェクトで、SQLを使ってApache Hadoop上で速く、簡単にビッグデータアプリケーションの開発ができるようになる。
-
GreenplumのPivotal HDがSQLのパワーとHadoopを結合する
EMC Greenplum が新しいHadoopディストリビューションの Pivotal HD を発表した。HDFS上で "Hiveより数百倍高速" に動作するという,SQL完全準拠のMPPデータベースを備える。
-
リアルタイムHadoopの実装競争が激しくなってきた
Hortonworksの新しいStingerイニシアチブが最高のリアルタイムHadoop実装を目指して、Apache Drill と Cloudera Impalaとの競争に加わった。
-
OracleのNoSQLデータベースを検証する
Oracleのキーバリュー型データベース,いわゆる "Oracle NoSQL Database" がバージョン2.0になった。基本的にはBerkley DBの分散フロントエンドだが,それをはるかに越える機能を備えたデータベースだ。SQLクエリ,結果整合性に加えて完全整合性,さらにはAvroスキーマを使用したデータ識別によるストレージ領域削減オプションなど,多彩な機能を備えている。
-
Simba TechnologiesがCassandra,Hadoop,BigQuery,MongoDBにSQLのパワーを実現する
SQLの本質は,非専門家のプログラマがデータベースに対してクエリを行って,レポートを作成することを目的に設計されたドメイン固有言語である。企業システムがリレーショナルデータベースからNoSQL製品へと移行しても,アドホックな帳票出力のニーズがなくなる訳ではなく,かえって難しいものになる。SimbaのODBCドライバは,ユーザの手にかつてのパワーを取り戻してくれる。
-
Hadoop + SQL Server + Excel = Big Data分析
数ヶ月前Microsoftは、管理、分析、大容量データの意味を知ることができるMicrosoftのHadoopディストリビューションである HDInsightをアナウンスした。InfoQは、SQL ServerのシニアプロダクトマーケティングマネージャのVal Fontama氏と接触して、MicrosoftでのエンタープライズBig Dataストーリーの成功例について確認した。
-
Netflix Hystrix - 複雑な分散システムへのレイテンシとフォールトトレランス
Netflixは、待ち時間や障害を許容して、リモートシステム、サービス、サードパーティライブラリへのアクセスポイントを制御するために設計されたライブラリであるHystrixをリリースした。 Hystrixは、スレッドやセマフォを分離して、フォールバックとサーキットブレーカー、リクエストキャッシュとリ��エスト収縮、モニタリングと構成と言った機能を提供する。
-
Apache AmbariでHadoopを管理
Shaun Conno氏が彼の新しいブログ記事で、Apache Ambariインキュベーションプロジェクトの重要さと2012年に達成した主要なマイルストーンを論じている。単純化したクラスタプロビジョニング、前設定された主要な運用メトリクス、ジョブ実行の仮想化、RESTful API、直感的UI。