InfoQ ホームページ Big Data に関するすべてのコンテンツ
-
Couchbase 4.6 Developer Previewリリース,Apache Spark 2.0およびKafka用のリアルタイムコネクタを追加
Couchbase 4.6 Developer Previewリリースは改善されたフルテキスト検索,グローバルに順序付けされたコンフリクト解決を備えたデータセンタ間レプリケーション,リアルタイム解析テクノロジ – Spark 2.0およびKafka – 用のコネクタなどを備える。
-
Spark Summit EUのハイライト - TensorFlow, 構造化ストリーミング,GPUハードウェアアクセラレーション
Apache SparkとディープラーニングライブラリTensorFlowとの統合,構造化ストリーミング(Structured Streaming)とGPUハードウェアアクセラレーションを使用したオンラインラーニング – この2つが,先週ブリュッセルで開催されたSpark Summit EU 2016のハイライトだ。
-
Apache Flinkを使用したZalandoのマイクロサービスおよびストリーム処理用アーキテクチャ
Javier Lopez氏とMihail Vieru氏はReactive Summit 2016 Conferenceで,クラウドベースのデータ統合と,ビジネスインテリジェンスのユースケースにおけるストリーミング処理で使用される分散プラットフォームについて講演した。
-
Confluentがマルチデータセンタレプリケーションを備えた企業向けKafkaを発表
Confluent Enterpriseの最新バージョンは,マルチデータセンタレプリケーション,自動データバランシング,クラウドマイグレーション機能をサポートする。Apache Kafkaベースのストリーミングプラットフォームを提供するConfluentは先週,ストリーミングデータパイプライン構築とストリーム処理アプリケーション開発を支援するConfluent Enterpriseの新機能を発表した。
-
新しいプライベートクラウドで"どこでも計算処理"を提供するWolfram
MathematicaやWolfram|Alphaなど,計算機能を中心とした製品を提供するソフトウェア企業のWolframが,計算業務の集中管理を望む企業をターゲットとした,新たなプライベートクラウドアプライアンスの提供を開始した。
-
Microsoft、インタラクティブなデータ探索とモデリングのためのデータサイエンスツールをリリース
Microsoftが、インタラクティブなデータ探索、モデリング、レポーティングのための2つの新しいデータサイエンスツールをリリースした。これらのツールは、プロジェクトにおける特定のタスクをデータサイエンスチームが再利用できるようにする。目標は、組織のさまざまなプロジェクトを横断して、データサイエンスタスクにおける一貫性と完全性を確保することだ。
-
IBMがコグニティブ・コンピューティ���グのための相変化メモリによる人工ニューロンの開発に成功
チューリッヒのIBM Researchにて,科学者チームが相変化材料(phase-change materials)を使用し,データの保持と処理が可能な人工ニューロンを開発した。 これら相変化ベースの人工ニューロンは,ビッグデータ(イベントベース・データのリアルタイム・ストリーム)におけるパターン認識や相関の発見に利用できる。また,教師なし学習を高速かつ小エネルギーで実施することができる。
-
Jey Kreps氏,Apache KafkaとKafka Streamsを利用した分散ストリーム処理を語る
Apache KafkaとKafka Streamsフレームワークは,ストリーム中心アーキテクチャと分散型ストリーム処理アプリケーションの開発を支援する。Jay Kreps氏(Confluent社のCEO)は,先週,Reactive Summit 2016 Conferenceにて,ストリーム処理とマイクロサービスに関する基調講演を行った。
-
ビッグデータ分析をSaaS方式で提供するAmazon Kinesis Analytics
イベントストリームのリアルタイム分析は,オンプレミス,クラウドいずれにおいても,ビッグデータプラットフォームの新たな焦点だ。AWSは新たに,Azure StreamAnalyticsに対抗するAmazon Kinesis Analyticsをリリースした。いずれのプラットフォームもシンプルなSQL言語を使用して複雑なクエリを記述可能にするとともに,ビッグデータ分析をSaaS的な領域に移行している。
-
リアクティブ サミット 2016 カンファレンス: リアクティブ マイクロサービスとステージング データパイプライン
リアクティブ マイクロサービス、データセンター スケール オペレーティング システ���(DCOS)、そしてステージング リアクティブ データ パイプラインは、今週のリアクティブ サミット 2016 カンファレンスにおける目玉であった。InfoQチームはカンファレンスに参加した。この記事は、カンファレンスの初日のサマリである。
-
ストリーム処理とLamdaアーキテクチャへの挑戦
Lamdaアーキテクチャはバッチとストリーム処理を結合させる有名なソリューションである。LinkedInのKatrik Paramasivam氏はデータ処理のためにApache Samzaを用いてチームがどうストリーム処理とLambdaアーキテクチャへの挑戦を行ったかを執筆した。この挑戦はイベントの遅延到着と複製メッセージの処理について記載されている。
-
データ科学に必要なデータとは
データ科学は必要とされるデータを扱うものであり,その基本は,どのデータを収集するか,データを生成するかあるいは保持するか,を決定することだ — データ科学の専門家として長い経験を持ち,Bookin.comの研究部門でプロダクトオーナを務める Lukas Vermeer氏はこのように主張する。真のイノベーションは大きな疑問で始まり,求めている答を得るためにデータが必要であることが明らかになるのだ。
-
Azure Premium Messaging ServiceがGAに到達
Microsoftは7月15日,Azure Premium MessageサービスがGA(General Availability)に到達したと発表した。Premium Messagingは,より予測可能性の高いメッセージパフォーマンスを求めるユーザを対象とするサービスだ。InfoQは今回のマイルストンについてさらなる洞察を得るべく,プリンシパルプログラムマネージャのDan Rosanova氏にコンタクトを取った。
-
Bashoが時系列データベースRiak TS 1.3をオープンソース公開
InfoQのRags SrinivasがBashoのCTOであるDave McCrory氏に,時系列データ処理に特化したRiak TS 1.3のオープンソース公開について話をきいた。
-
Neha Narkhede氏が語る - Apache Kafkaを使用した大規模ストリーム処理
QCon New York 2016で行われたプレゼンテーション“Large-Scale Stream Processing with Apache Kafka”の中で,Neha Narkhede氏は,ストリーミングデータを処理するKafkaの新機能であるKafka Streamを紹介した。アンバウンドなデータが多く見られるようになったことにより,ストリーミング処理は一般的なものになった,とNarkhede氏は言う。マシンラーニングの例でも見られるように,もはやニッチな問題ではないのだ。