BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Big Data に関するすべてのコンテンツ

  • Amazon Web ServiceがMachine Learningサービスをリリース

    Amazon Web Serviceは先日,クラウド上で予測モデルの学習が可能なAmazon Machine Learningサービスをローンチした。GoogleのPrediction API,MicrosoftのAzure Machine Learningに続いてAmazonは,この種のサービスを提供する最後発の大手クラウドプロバイダになる。

  • Googleがクラウドプラットフォームのデータサービスとネットワークサービスを拡張

    GoogleはCloud DNSの一般提供とロードバランスのロケーション拡大,ピア接続対象のキャリアプロバイダ追加,Cloud DataflowとVPNサービスのベータ提供開始を発表した。

  • Apache HBaseが1.0に

    3つのDeveloper Previewと、6つのRC、1500を超えるチケットクローズを経て、Apache FoundationはApache HBaseのバージョン1.0を発表した。HBaseはHadoopエコシステムにおけるNoSQLデータベースだ。 アクティブな開発から7年以上経て、HBaseチームは1.0バージョンを名乗れるくらい成熟し、安定したと考えた。

  • MicrosoftがRevolution Analyticsを買収

    Microsoftは、昨年Revolution Analytics社を買収し、データサイエンスコミュニティへ接近した。Revolution Analytics社はオープンソースのRプロジェクトをベースにしたソフトウェアやサービスを提供している。この買収によって、Microsoftの製品にRの能力が反映され、Rを使ったソリューションが企業分野に出現することが予想される。

  • Apache Spark 1.3リリース - DataFrame,SparkSQL,MLibを拡張

  • Google、Hadoop上でネイティブコードを動かすMR4Cをオープンソース公開

    GoogleがCのためのオープンソースMapReduceフレームワーク「MR4C」を発表した。これを利用することにより、開発者はHadoopフレームワーク上でネイティブコードを動かすことができる。MR4Cフレームワークは、ネイティブ開発されたアルゴリズムのパフォーマンスおよび柔軟性と、Hadoop実行フレームワークが提供するスケーラビリティおよびスループットとの間を橋渡しするものだ

  • Pivotal が Big Data Suite をオープンソース化

    Pivotal社は、自身のBig Data Suiteのコア・コンポーネントをオープンソース化することを決定するとともに、ビッグデータ用のオープンソースの普及促進および標準化のための Open Data Platform を発表した。

  • Apache Hive 1.0リリース,HiveServer2がメインエンジンに,API定義を固定化

    Apache Hiveは,2015年2月6日,同プロジェクトのバージョン1.0をリリースした。当初バージョン0.14.1として予定されていたが,コミュニティの投票により,プロジェクトの到達した完成度の高さを反映すべく,バージョンナンバを1.0.0に変更したのだ。

  • Apache Flink 0.8.0リリース,2015年のロードマップを公開

    Apache Flinkがプロジェクトのバージョン0.8.0をリリースした。パフォーマンスや互換性,安定性の向上といった一般的な改善の他,これまで欠けていたストリーミング機能に関するScala APIが追加されている。さらに,インキュベータへの参加からおよそ9ヶ月で,Apacheトップレベルプロジェクトへの昇格も果たした。

  • Google機械学習の技術的負債

    Googleの研究員やエンジニアたちが、NIPSのワークショップで、機械学習を使うことの技術的負債に対する見解を発表した。発表者たちは技術的負債の様々な側面を明らかにし、適切に対処しなければ、機械学習や企業の複雑なデータ分析を使うことは、従来のソフトウェアエンジニアリングとは異なる新しい技術的負債を生み出すと結論付けた。

  • インスタントピボット,拡張イベントパターン検出をサポートするSplunk Enterprise 6.2

    ビッグデータ解析ツールSplunk EnterpriseとHunkの最新バージョンでは,インスタントピボット,強化されたイベントパターン検出,ビルド済みのダッシュボードパネルなどがサポートされている。オペレーショナルインテリジェンスのためのソフトウェアプラットフォームプロバイダであるSplunk Inc.は先頃,Splunk EnterpriseとHunkのバージョン6.2,HadoopとNoSQLデータストア用のSpulnk解析ツールの一般供用開始(GA/General Availabiity)を発表した。

  • Splice Machine バージョン1.0,Hadoop統合と分析ウィンドウ関数をサポート

    Spline Machineバージョン1.0は,分析ウィンドウ関数とHadoopエコシステム統合をサポートする。Splice Machineチームは先頃,Hadoopでのトランザクション処理に使用可能な,HadoopベースのRDBMSデータ管理ソリューションをリリースした。

  • GoogleがCloud Dataflow Java SDKをオープンソースに

    Googleは今年初め,Cloud Dataflowを発表した。大量のデータをバッチ,あるいはリアルタイムで処理するためのサービスとSDKだ。そして今回,同社はDataflow Java SDKをオープンソースにした。開発者がその動作内容を確認したり,オンプレミスあるいはクラウド上で動作するサービスにSDKを使用することが可能になる。

  • 2015年1月のThoughtWorks Radar

    ThoughtWorksは2015年1月のレーダーのデジタルプレビューを発表し、技術、ツール、プラットフォーム、言語について意見を公表し、ソフトウエア技術に関する現在のトレンドを発表した。

  • LinkedInのデータ取得プラットフォームGobblin

    2014 QCon San FranciscoカンファレンスでLinkedInのLin Qiao氏はGobblinプロジェクトについて話をした(ブログにも説明がある)。このプロジェクトは内部と外部のデータソースから統一した方式でデータを取得するためのシステムだ。

BT