InfoQ ホームページ Big Data に関するすべてのコンテンツ
-
TwitterがMapReduceストリーミングフレームワークSummingbirdをオープンソースに
Twitterは,Summingbirdと呼ぶ自社のMapReduceストリーミングフレームワークをオープンソースにした。Apache 2ライセンスで公開されるSummingbirdは,コードをバッチモード(Hadoop/MapReduceをベースとする)でもストリームモード(Stormをベースとする)でも,あるいはハイブリッドモードと呼ばれる2つの組み合わせでも同じように実行することができる,大規模データ処理システムだ。
-
-
データラングリング・アズ・ア・サービスの簡易化を目指すTrifacta
データ解析サービスプラットフォームのTrifactaは先頃,データアナリストのデータラングリング(Data Wrangring)作業支援という同社の活動を推進するため,VCによる出資を受け入れた。目標はデータ収集とクレンジング,マージといった作業を,現在よりはるかに少ない時間と労力で可能にすることだ。
-
EC2でMesosによるクラスタの自動デプロイを実現するElastic Mesos
EC2上でApache Mesosの自動デプロイが可能になった。Apache Mesosはクラスタのリソース全体を,複数のデータ処理フレームワークで共有するオープンソースツールである。使用されているのは,ビッグデータの新興企業Mesosphereが提供するElastic Mesosという,新しいWebサービスだ。
-
オープンソースのSQL-in-Hadoopソリューション:我々はいまどこに?
Facebookが最近Prestoをオープンソース化してリリースしたことで、既に飽和状態だったSQL-in-Hadoopマーケットがさらに錯綜している。多数のオープンソースツールが開発者の関心を集めようとしのぎを削っているのだ。Hortonworks社によるHive関連のStinger initiative, Apache Drill, Apache Tajo, Cloudera社の Impala, Salesforce社の Phoenix (for HBase),そして今回のFacebook社のPrestoがこれに挙げられる。
-
HadoopジョブをGPU上で実行するParallelX
MapReduceパラダイムは,大規模な計算集約的アルゴリズムを扱う場合には,必ずしも理想的ではない。ある企業家の小さなチームが,これを解決するためにParallelXという製品を開発している。GPUのパワーを活用してHadoopジョブを強力に加速することで,ボトルネックを解消しようというものだ。
-
Netflix、ビッグデータがビジネス判断を動かす
NetflixのJeff Magnusson氏が、彼らのData Platform as a ServiceについてQCon SF 2013でプレゼンテーションをした。このプレゼンテーションをフォローアップして、技術スタックがどうなっていて、それがNetflixの重要なビジネス判断にどう役立っているのか説明する。
-
加速する変化のペースが企業アプリケーションにアジャイルを促す
組織の変化とテクノロジー導入のペースが加速している。つまり、企業ソフトウェア開発は、こうした変化のペースに対応する方法を見つける必要があるということだ。ビッグデータの登場もまた、多数の実験を始めて、すばやく適応する必要性を促している。ブロガーであるMongoDBのMatt Asay氏は最近、"Hey, Enterprise Developers! Get Agile Or Get Steamrollered"という記事を書いた。
-
Amazon re:inventのまとめ
Amazonはロサンゼルスで開かれたre:inventカンファレンスで、たくさんの新サービスを発表した。Amazon WorkSpaces - デスクトップコンピューティングをクラウドで、SAMLを使用したIdentity and Access Management、Amazon AppStream - クラウドからアプリケーションをストリーミング提供、Amazon Kinesis - ビッグデータをストリーム処理、CloudTrail - AWS APIコールの記録を保存、RDSのPostgresサポート、新しいEC2インスタンスタイプ
-
Cascading 2.5がHadoop 2をサポート
今週リリースされたCascadingの新バージョンにはHadoop 2のサポートとCascading Lingualが含まれている。Cascading Lingualは,Hadoopベースのデータにアクセスする手段として包括的なANSI SQLインターフェースを提供する,オープンソースのプロジェクトだ。
-
Amazon Kinesisでビッグデータをストリーム処理
Amazonがさまざまなソースにある大規模データをストリーム処理できるサービス、Kinesisを発表した。現在、限定プレビューとして利用できる。
-
Amazon EMRのベストプラクティス
Best Practices for Amazon EMRというホワイトペーパーで、Parviz DeyhimはAWS EMRのベストプラクティスを説明している。データの移行やデータの収集、圧縮、集約の方法やAmazon EMRの構成の一般的なアーキテクチャパターンを説明している。
-
Go Big: CA World 2013 オープニング基調講演
カンファレンスの現地レポートというInfoQの伝統に従って,CA World 2013のオープニング基調講演を現地からお届けする。CA WorldはSaaS,モバイル,DevOps,ビッグデータといった分野の製品,技術,テクノロジを中心とするカンファレンスである。基調講演の最初を飾ったのはCA Technologiesの新CEO,Mike Gregoire氏だ。
-
IBMのMobile First - MBaaS,ビッグデータ,それ以上のものをエンタープライズに
IBMは現在のモバイルコンピューティングのトレンドをキャッチアップする包括的システムないしスイート,あるいは同社の説明ではアプリケーションポートフォリオを構築した。Mobile Firstという名のこのシステムは,トレンドに乗り切れていない組織がいまだテーブルに残したままの数十億ドルの市場から,ユーザ企業がシェアを獲得するためデザインされたものだ。
-
Gartnerの示す情報インフラ技術トレンド: ビッグデータ,NoSQL,インメモリ・コンピューティング
ビッグデータとNoSQLデータベース,そしてインメモリ・コンピューティングが,2013年以降の現代的な情報管理において重要な役目を果たすテクノロジだ – Gartner はそのように予想する。同社の調査チームがリリースした 最新レポート には,情報インフラストラクチャとガバナンスに影響を与えるであろう最先端の技術トレンドとして,この3つが示されている。