InfoQ ホームページ Apache_Spark に関するすべてのコンテンツ
-
Neha Narkhede氏が語る - Apache Kafkaを使用した大規模ストリーム処理
QCon New York 2016で行われたプレゼンテーション“Large-Scale Stream Processing with Apache Kafka”の中で,Neha Narkhede氏は,ストリーミングデータを処理するKafkaの新機能であるKafka Streamを紹介した。アンバウンドなデータが多く見られるようになったことにより,ストリーミング処理は一般的なものになった,とNarkhede氏は言う。マシンラーニングの例でも見られるように,もはやニッチな問題ではないのだ。
-
Databricks による、SparkとTensorFlowを用いたディープラーニング
昨年の終わり頃にGoogleが同社の機械学習ライブラリであるTensorFlowをオープンソースするという発表を行い、InfoQが取材をして以来、データサイエンスコミュニティは各々のプロジェクトでTensorFlowを試す機会を得た。
-
Apache Spark 2.0テクニカルプレビュー
Databricksは、Apache Sparkの最初のリリースの2年後に、上流ブランチ2.0.0-previewを基にした、Apache Spark 2.0のテクニカルプレビューを発表した。このプレビューは、安定性とAPIの両方の観点で本番環境向けではなく、一般提供リリースの前にコミュニティからのフィードバックを集めることを目的にしているリリースである。
-
Yahoo!がApache Flink, Spark, Stormのベンチマークを実施
Yahoo!は,代表的なストリーム処理フレームワークであるApache Flink, Spark, Stormの3つを対象としたベンチマークを行った。
-
インメモリ分析,キャッシュ,検索をサポートし,NoSQLに統合するBasho Data Platform
Basho Data Platformは,RedisなどNoSQLデータベースとインメモリ分析,キャッシュ,検索といった機能の統合をサポートする。Riak NoSQLデータベースの提供企業であるBasho Technologiesは5月,ビッグデータやIoT,ハイブリッドクラウドアプリのデプロイと管理の可能なデータプラットフォームの提供を発表した。