InfoQ ホームページ Data-Analytics に関するすべてのコンテンツ
-
Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来
Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が,カラム指向データ処理の今後について,Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく,氏にインタビューした。
-
Apache Flinkを使用したZalandoのマイクロサービスおよびストリーム処理用アーキテクチャ
Javier Lopez氏とMihail Vieru氏はReactive Summit 2016 Conferenceで,クラウドベースのデータ統合と,ビジネスインテリジェンスのユースケースにおけるストリーミング処理で使用される分散プラットフォームについて講演した。
-
リアクティブ サミット 2016 カンファレンス: リアクティブ マイクロサービスとステージング データパイプライン
リアクティブ マイクロサービス、データセンター スケール オペレーティング システム(DCOS)、そしてステージング リアクティブ データ パイプラインは、今週のリアクティブ サミット 2016 カンファレンスにおける目玉であった。InfoQチームはカンファレンスに参加した。この記事は、カンファレンスの初日のサマリである。
-
ストリーム処理とLamdaアーキテクチャへの挑戦
Lamdaアーキテクチャはバッチとストリーム処理を結合させる有名なソリューションである。LinkedInのKatrik Paramasivam氏はデータ処理のためにApache Samzaを用いてチームがどうストリーム処理とLambdaアーキテクチャへの挑戦を行ったかを執筆した。この挑戦はイベントの遅延到着と複製メッセージの処理について記載されている。
-
Apache Flinkを用いたデータストリーミングアーキテクチャ
Jamie Grier氏がApache Flinkを用いたデータストリーミングアーキテクチャについてOSCON 2016 Conferenceで講演した。データストリーミングアプリケーションの構成要素とステートフルなストリーミング処理について、Flinkアプリケーションのサンプルコードとモニタリングをまじえて紹介した。
-
Google、Cloud Machine LearningとTensorFlowのα版リリース
先月、GoogleがTensorFlowをインテグレートしたクラウド機械学習サービスのα版をリリースした。このサービスは、TensorFlowライブラリをGoogle Cloud Platform (GCP)上でスケールさせて動かしたいというニーズの高まりに応えるものだ。Googleは自らのビッグデータおよびアナリティクスプラットフォームと機械学習を密にインテグレートするという発表の中で、HadoopとSparkのマネージドサービスであるDataprocなどと統合して、TensorFlowの利用をスケールさせるための新機能について説明している。
-
IBMがクラウドデータアナリティクス���ービスを拡大
IBMが、4つの新しいデータサービス、Analytics Exchange、Compose Enterprise、Graph、Predictive Analyticsを発表した。IBMの新しいデータサービスにより、ユーザは自分のデータを分析したり、IBMが提供するデータセットにアクセスしたりできるようになる。Bluemixで動くサービスの他に、プライベートなものも含むクラウド上で、データは展開できる。
-
Airbnbのネットプロモータースコアの使い方
ネットプロモータースコア(NPS)は、顧客のロイヤリティのメトリクスであり、顧客が企業のウェブサイトやサービスを再び使ってくれるかどうかの指標に使われる。AirbnbはNPSを拡張して使うことで顧客のロイヤリティを計測している。顧客が再び予約してくれるか、サービスを友人に薦めてくれるかについて明らかにするためのメトリクスとしてこの方法が効果的であると考えているのだ。
-
-
Yahoo!がApache Flink, Spark, Stormのベンチマークを実施
Yahoo!は,代表的なストリーム処理フレームワークであるApache Flink, Spark, Stormの3つを対象としたベンチマークを行った。
-
IBMが50プロジェクトのオープンソース化ヘ
IBMがdeveloperWorks Openという新しいポータルサイトを公開した。このサイトは、オープンソースの様々なプロジェクトをまとめたサイトであり、アナリティクス、クラウド、IoT、モバイル、セキュリティ、ソーシャル、Watsonその他を含む数多くのドメインを扱う。今までのところ、IBMは約30プロジェクトをオープンソース化し、2015年の終わりまでに50に増やすことを計画している。そして、将来的にはさらに増やすつもりだ。
-
Glenn Tamkin氏、NASA大規模気候データへのApache Hadoop適用を語る
NCCS (NASA Center for Climate Simulation) はハイパフォーマンスデータ分析にApache Hadoopを使っている。NASAチームのGlenn Tamkin氏は先月のApacheCon Conferenceで講演し、Hadoopを使って構築した、気候データ分析のためのプラットフォームの詳細について説明した。
-
インスタントピボット,拡張イベントパターン検出をサポートするSplunk Enterprise 6.2
ビッグデータ解析ツールSplunk EnterpriseとHunkの最新バージョンでは,インスタントピボット,強化されたイベントパターン検出,ビルド済みのダッシュボードパネルなどがサポートされている。オペレーショナルインテリジェンスのためのソフトウェアプラットフォームプロバイダであるSplunk Inc.は先頃,Splunk EnterpriseとHunkのバージョン6.2,HadoopとNoSQLデータストア用のSpulnk解析ツールの一般供用開始(GA/General Availabiity)を発表した。
-
IBM: 企業の70%がビッグデータ、クラウド、モバイル、ソーシャルを活用している
IBMはRaising the game - The IBM Business Tech Trends Study (PDF)と題した調査結果を発表した。同社はこの調査で次の4つの重要な技術の現在の普及状況を調べている。すなわち、ビッグデータ&アナリティクス、クラウド、モバイル、ソーシャルの4つだ。この4つがエンタープライズ分野でどの程度普及しているのかを2012年と比較している。また、PacesettersとDabblersの比較も行っている。
-
Netflix、ビッグデータがビジネス判断を動かす
NetflixのJeff Magnusson氏が、彼らのData Platform as a ServiceについてQCon SF 2013でプレゼンテーションをした。このプレゼンテーションをフォローアップして、技術スタックがどうなっていて、それがNetflixの重要なビジネス判断にどう役立っているのか説明する。