InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
SQLite 3.9がJSON, 式のインデックスをサポート
先日リリースされたSQLite 3.9には,JSONエンコード/デコードのサポート,全文検索(Full Text Search)バージョン5,式のインデックス(index on expression),エポニマス仮想テーブル(eponymous virtual table)など,数多くの新機能と拡張機能が提供されている。
-
TensorFlow: Googleが自社の機械学習ツールをオープンソース化
TensorFlowは、GoogleのBrain Teamの研究者たちが作った機械学習ライブラリだ。このたびApache License 2.0のもとオープンソースとして公開された。TensorFlowの詳細については、ホワイトペーパー「TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems」に書かれている。ソースコードはGoogle Gitで公開されている。
-
LinkedIn、リードオンリーキーバリュー型ストアのPalDBをオープンソース化
LinkedInhが組み込み可能なリードオンリー・キーバリュー型ストア、PalDBをオープンソース化した。PalDBはLevelDBよりも8倍高速で、HashSetよりも数倍消費メモリが小さいという。
-
HortonworksがデータフローベースのNiFiでIoATに対応
HortonworksはDataFlowプラットフォームの提供をひっそりと開始した。Apache NiFiをベースとして,IoATの処理ニーズ解決を目指す。
-
SpringXDがアーキテクチャと名称を変更し,Spring Cloud Data Flowに
Pivotalは先週のSpringOne2GXカンファレンスで,同社のビッグデータ製品であるSpring XDを完全に再設計し,名称をSpring Cloud Data Flowに改めることを発表した。新たな製品で重視されているのはオーケストレーションだ。
-
Amazon、QuickSightを発表
AmazonがAWS Re:inventカンファレンスでQuickSightを発表した。これは完全なビジネスインテリジェンスソリューションであり、顧客がAWSに格納されたデータから洞察を得る助けをする。
-
Microsoft が Azure Data Factory をリリース
Data Gravity を信じているクラウド提供者は、自身の設備内にデータを収集・格納されるのを容易化する試みを行っている。クラウドとオンプレミス間のエンドポイント間でのデータ移動を容易化するため、近年 Microsoft は Azure Data Factory (ADF)の一般提供を宣言した。
-
SalesforceがIoT市場に参入
先日のSalesforceのDreamforceカンファレンスにおいて、同社は リアルタイムのデータ収集やクラウドベースのサービススイートで実施可能なタスクに取り込むことができるIoTプラットフォームを発表した。
-
GoogleのCloud DataflowがGAに到達
8月12日にGoogleは,同社のビッグデータ処理サービスがGA(General Availability)に達したことを発表した。このマネージドサービスは,ビッグデータソリューションが処理するデータを事前に操作する,パイプラインを構築するためのものだ。このCloud Dataflowでは,統合モデルでストリーミングとバッチプログラムの両方をサポートする。
-
IBMが50プロジェクトのオープンソース化ヘ
IBMがdeveloperWorks Openという新しいポータルサイトを公開した。このサイトは、オープンソースの様々なプロジェクトをまとめたサイトであり、アナリティクス、クラウド、IoT、モバイル、セキュリティ、ソーシャル、Watsonその他を含む数多くのドメインを扱う。今までのところ、IBMは約30プロジェクトをオープンソース化し、2015年の終わりまでに50に増やすことを計画している。そして、将来的にはさらに増やすつもりだ。
-
データの品質を向上する - Preziのケース
組織がデータ駆動型であるためには,データの山を積み上げるだけでは不十分だ。 そのデータが正確で,かつ意味を持っていなくてはならない。PreziのデータエンジニアであるJulianna Göbölös-Szabó氏は,同社がどのようにデータの品質を向上したかについて講演した。氏らが選択したソリューションは,全チームを正しい方向に向かわせる手段として,契約をベースとした軽量アプローチを採用し,それによって非構造的データから構造的データに移行する,というものだ。
-
データ科学を活用してモニタリングを改善する
先日のDevOpsDays Amsterdam 2015でPatrick Roelke氏は,モニタリングにはまだ多くの問題があることを強く論じた。データ科学によって静的しきい値という概念を排除し,さまざまなデータソースからの情報をひとつのメトリックに統合することで,事態を改善できるのではないか,というのが氏の考えだ。講演ではKale,Bosun,AnomalyDetectionなど,データ科学を活用したモニタリングツールの概要が紹介された。
-
インメモリ分析,キャッシュ,検索をサポートし,NoSQLに統合するBasho Data Platform
Basho Data Platformは,RedisなどNoSQLデータベースとインメモリ分析,キャッシュ,検索といった機能の統合をサポートする。Riak NoSQLデータベースの提供企業であるBasho Technologiesは5月,ビッグデータやIoT,ハイブリッドクラウドアプリのデプロイと管理の可能なデータプラットフォームの提供を発表した。
-
超解像画像のための深層畳み込みニューラルネットワーク
Flipboardが低解像画像をアップスケールするというDeep Learningの応用について報告し、この学習アルゴリズムのパワーと柔軟性を示した。
-
Google、Cloud Bigtableを公開
GoogleはCloud Bigtableを公開した。これはSearch、GMail、Maps、YouTubeといったサービスで10年以上使われてきたGoogle自身のデータベースだ。他のプロダクトと同様に、Bigtableがオープンソース化されたわけではないが、新しいクラウドサービスはオープンソースのインターフェイス、Apache HBase 1.0.1 APIを通じてアクセスできる。