InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
PostgreSQLのNoSQL機能が大幅に向上
PostgreSQL 9.4 Beta版には待望の"バイナリJSON"型,JSONBが実装されている。この文書データのための新しいストレージ形式には,JSONデータをハイパフォーマンスに操作するためのインデックス処理,関数,演算子が用意される。
-
SplunkがHunk 6.1をリリース
Splunkは機械が生成したデータを検索や監視、分析することに特化した企業だ。同社はHunk 6.1のリリースを発表した。Hunkはビッグデータ分析のプラットフォームを提供する。ストリーミングリソースライブラリを使うことで開発者はHunkをどのようなNoSQLエンジンにも接続できるようになった。Apache CassandraやMongoDBやNeo4jなどだ。
-
Cascading 3.0 が複数のフレームワークをサポート。 Concurrent Driven によるビッグデータアプリケーションの管理
ConcurrentはCascading 3.0 を初夏にリリースする予定である。これを使えばMapReduce、Tez、Spark、Storm等の複数のビッグデータフレームワーク上で特定のアプリケーションを実行できる。さらに、Drivenという新しいConcurrentの商用製品はビッグデータ・アプリケーションのための強力なエンタープライズ・データ・アプリケーション管理機能を提供する。
-
ApacheCON NA 2014,テーマは”コミュニティ"
今年のApacheCON North Americaカンファレンスの基調講演のおもなテーマは,オープンソースとそのコミュニティだった。400人以上の参加者と70を越えるプロジェクト,180のセッションが用意されたカンファレンスでは,Apache Software Foundation (ASF)のプロジェクトと同じように,さまざまな話題が数多く取り上げられていた。
-
Twitterのリアルタイムマルチテナント分散データベースManhattan
Twitter EngineeringはManhattanについて詳細を発表した。Manhattanはリアルタイムマルチテナント分散データベースだ。
-
Oracle NoSQL Database 3.0がテーブルデータモデルと2次インデックスをサポート
Oracleは先頃,キー・バリュー型分散データベースOracle NoSQL Databaseのバージョン3.0をリリースすると発表した。最新バージョンではテーブル形式のデータモデルと2次インデックスを新たにサポートし,Oracle Walletとの統合によるセキュリティ改善,データセンタのサポート拡張を提供する。
-
ビッグデータHadoopソリューション、2014年第一四半期の状況
最新のForrest reportによると、Hadoopの勢いはとどまるところを知らない。エンタープライズでのHadoopの使用は、新しい方法でのデータの保存、処理、分析、そしてビッグデータの共有などの能力により、継続的に増加している。このレポートでは各Hadoopベンダーに注目し、ランク付けを行っている。
-
ClouderaがMongoDBと提携,Hadoopデータを同社のNoSQL DBに
現在の"企業データの80%が非構造であり,構造データの2倍の速度で増加している"という事実を前置きに,ClouderaとMongoDBの2社は,ApacheベースのビッグデータプラットフォームとNoSQLソリューションの組み合わせをオプションとして提供する"戦略的"パートナーシップを発表した。
-
継続的開発は新しいメンテナンスの現実か?
モノのインターネット、Web API、ビッグデータは継続的開発を現実のものとし、開発者を完成したアプリケーションのメンテナンス作業に釘付けにするだろう。Dr.DobbsのAndrew Binstock氏はそう語る。開発者の時間を有効活用するためには、短期スプリント、継続的インテグレーションおよびデプロイメント、最新のプログラミングプラクティスがこれまで以上に重要になる。
-
DataBricks,Sparkで構造化データを操作するSpark SQLを発表
Apache Sparkを開発するDataBricksは,SparkエコシステムにSpark SQLという新たな製品を投入すると発表した。Spark SQLはSparkから独立した製品で,Hiveを内部的に使用していない。InfoQでは同社のソフトウェア技術者であるReynold Xin,Michael Armbrust両氏とコンタクトを取り,Spark SQLについて詳しく聞いた。
-
Hadoopに挑むHydra
ソーシャルネットワーク企業のAddThisは先日,HydraをApacheバージョン2.0ライセンスの下で,オープンソースとして公開すると発表した。Hydraは,半構造化ソーシャルデータをライブストリームとして処理することで,それらのデータに対する効率的なクエリ処理を実現するために開発された,同社の社内プラットフォームを発展させたものだ。
-
セルベースのセキュリティが導入されたHBase 0.98
ApacheはHBase 0.98をリリースした。セルベースのセキュリティを通じてApache Accumuloとの共通化を計ると同時に,230以上のJIRAイシューを解決することを主な目的としている。新たに導入されたセキュリティ機能は,Accumuloをモデルとしたものだ。
-
ThoughtWorks Technology RadarについてRebecca Parsons氏が語る
1月、ThoughtWorksは最新のTechnology Radarで、同社が追跡しているソフトウエア開発のエコシステムの動向を発表した。1)プロダクション環境での警告システムとリカバリ、2)プライバシとビッグデータの緊張関係、3)JavaScriptのエコシステム、4)物理と仮想の環境の境界の曖昧化、の4つが今年の大きなテーマだ。
-
Cassandra、2.1リリースに向け勢いづく
Cassandraは2.1リリースに向けて鋭意開発が進められており、2.1.0-beta1もすでにリリースされている。この記事では最新のメジャーリリースで追加された主要な解く著について概観する。DataStaxの支援によって、企業向けの導入も進んでおり、DataStaxは最新パートナーシッププログラムを発表している。
-
ビッグデータ技術を用いたグラフ処理
極度に大きなグラフの処理は現在でもなお難しい問題だ。しかし最近のビッグデータ技術の進歩は,このようなタスクをより実用的なものにしている。ニューヨークを拠点にクロスデバイスなコンテント配信を手掛けているTapadはビッグデータを活用して,テラバイトサイズのデータにまで拡張可能なグラフ処理を,ビジネスモデルの中心とするスタートアップだ。