InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Riley Newman氏が語るAirbnbでのデータサイエンス
Airbnbでデータサイエンスの責任者を務めるRiley Newman氏は同社がどのようにしてデータサイエンスを定義し活用しているのかを記事にした。氏はデータは顧客の声であり、データサイエンスは解釈する活動であると説明している。また、データサイエンスをスケールするためのいくつかの重要な動きについても説明している。チームに直接、データサイエンティストを入れることやあらゆるビジネスプロセスのすべてにデータサイエンスを統合すること、高速で安定的なデータインフラを構築することなどだ。
-
FsLabを使ったF#でのデータサイエンス
F#のデータサイエンス用ライブラリであるFsLabは2015年の始めにオープンソースで公開された。InfoQは開発者であるTomas Petricek氏に詳しい話を聞いた。
-
QCon New Yorkが2016年6月13-17日に戻ってくる
第5回QCon New Yorkの参加登録が始まった。このイベントはチームにイノベーションをもたらすソフトウェアのアーキテクト・テックリード・リーダーのための実践者によるカンファレンスだ。QCon New Yorkはブルックリン橋のNew York Marriottで開催され、12月19日までに登録すればチケットは$1645だ。
-
TeradataがIoTデータのリアルタイム解析に対応した新ソフトウェアを発表
2015年のPartners User Group Conferenceで,Teradataは,IoTデータの大規模ストリームのリアルタイムな取り込み(Ingestion)と分析(analysis)という,2つの機能のソフトウェアを新たに発表した。さまざまなIoTデータストリームを複数同時かつリアルタイムに“listen”可能なTeradata Listenerと,大量のIoTデータストリームに対応したスケーラブルな分析機能を新たに提供するTeradata Aster Analytics on Hadoopである。
-
Basho TechnologiesがNoSQLデータベースのRiak TSをリリース,時系列データの格納と解析に対応
Basho Technologiesは,時系列データの保存と分析を目的としたNoSQL分散データベースのRiak TSをリリースする。Bashoチームは先日のAWS re:inventイベントで,時系列データの読み取りと書き込みに最適化されたRiak TSの提供を発表していた。
-
Couchbase 4.0が多次元スケーリング,地理空間インデックス,新クエリ言語N1QLをサポート
NoSQLドキュメント指向データベースCouchbaseの最新バージョンは,多次元スケーリング,地理空間インデックス(geospatial index),新クエリ言語N1QLをサポートする。Couchbaseチームは今月初め,Couchbase Server 4.0バージョンの一般向け提供を発表した。XDCR(Cross Datacenter Replication/クロスデータセンタレプリケーション)で新たにフィルタ機能をサポートした他,セキュリティも向上している。
-
2015年11月のThoughtWorks Radar
ThoughtWorksが2015年11月のRadarを公開した。これはテクノロジーを4つのエリア、言語とフレームワーク、プラットフォ��ム、テクニック、ツールに分けたものだ。
-
DMTK、Microsoftの機械学習ツールキット
GoogleによるTensorFlowのオープンソース化とほぼ時を同じくして、MicrosoftがGitHubにDMTK(Distributed Machine Learning Toolkit)をプッシュした。GoogleがリリースしたのはTensorFlowの単一マシンバージョンだが、MicrosoftのリリースしたDMTKはクラスタ上で動作する。
-
SQLite 3.9がJSON, 式のインデックスをサポート
先日リリースされたSQLite 3.9には,JSONエンコード/デコードのサポート,全文検索(Full Text Search)バージョン5,式のインデックス(index on expression),エポニマス仮想テーブル(eponymous virtual table)など,数多くの新機能と拡張機能が提供されている。
-
TensorFlow: Googleが自社の機械学習ツールをオープンソース化
TensorFlowは、GoogleのBrain Teamの研究者たちが作った機械学習ライブラリだ。このたびApache License 2.0のもとオープンソースとして公開された。TensorFlowの詳細については、ホワイトペーパー「TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems」に書かれている。ソースコードはGoogle Gitで公開されている。
-
LinkedIn、リードオンリーキーバリュー型ストアのPalDBをオープンソース化
LinkedInhが組み込み可能なリードオンリー・キーバリュー型ストア、PalDBをオープンソース化した。PalDBはLevelDBよりも8倍高速で、HashSetよりも数倍消費メモリが小さいという。
-
HortonworksがデータフローベースのNiFiでIoATに対応
HortonworksはDataFlowプラットフォームの提供をひっそりと開始した。Apache NiFiをベースとして,IoATの処理ニーズ解決を目指す。
-
SpringXDがアーキテクチャと名称を変更し,Spring Cloud Data Flowに
Pivotalは先週のSpringOne2GXカンファレンスで,同社のビッグデータ製品であるSpring XDを完全に再設計し,名称をSpring Cloud Data Flowに改めることを発表した。新たな製品で重視されているのはオーケストレーションだ。
-
Amazon、QuickSightを発表
AmazonがAWS Re:inventカンファレンスでQuickSightを発表した。これは完全なビジネスインテリジェンスソリューションであり、顧客がAWSに格納��れたデータから洞察を得る助けをする。
-
Microsoft が Azure Data Factory をリリース
Data Gravity を信じているクラウド提供者は、自身の設備内にデータを収集・格納されるのを容易化する試みを行っている。クラウドとオンプレミス間のエンドポイント間でのデータ移動を容易化するため、近年 Microsoft は Azure Data Factory (ADF)の一般提供を宣言した。