InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Apache Eagleがトップレベルプロジェクトに昇格
ビッグデータプラットフォーム上でのセキュリティおよびパフォーマンスに関する問題を特定する,オープンソースソリューションのApache Eagleが,2017年1月10日,Apacheのトップレベルプロジェクトに昇格した。eBayが2015年10月にオープンソースとしたEagleは,機密データへのアクセスや悪意のある活動を簡単に検出し,タイムリに対応する目的で開発されたソフトウェアだ。
-
Microsoftがドローンとロボットのためのシミュレータ、AirSimをリリース
MicrosoftがAirSimを開発してオープンソース化した。これは世界各地におけるドローンの飛行をシミュレートするのに使えるツールだ。シミュレータはUnreal Engineで作られており、Microsoftはまもなくロボットや他の種類の車両のサポートを追加する予定だ。
-
Apache HBase 1.3リリースで多数のパフォーマンス改善
Apache HBase 1.3.0は、2017年1月中旬にリリースされた。今回のリリースでは、日付ベース階層圧縮がサポートされ、ログ先行書き込み(WAL)や新しいRPCスケジューラなど複数箇所で改善があった。このリリースには、合計で約1,700件の解決済みのissueが含まれている。
-
MindMeldの対話型アプリケーション構築ガイド
対話型(会話型)AI企業のMindMeldが、対話型アプリケーションを作成するための課題と手順を説明した「The Conversational AI Playbook」を公開した
-
話題満載のQCon London 2017 ,Jonas Boner,Sachine Kulkami,Martin Thompson氏らが講演
QCon London 2017まであと50日となった。11年目を迎え,栄えあるQueen Elizabeth II Conference Centerで3月6~8日に開催される技術会議に向けて,チケットの売れ行きも好調だ。
-
Neo4j 3.1がリリース - Causal Clusteringをサポート,セキュリティを強化
NoSQLグラフデータベースNeo4jの最新バージョンには,Causal Clustering(因果クラスタリング)と新たなセキュリティアーキテクチャが導入されている。Neo4jチームは先頃,同グラフデータベースのバージョン3.1をリリースした。その他の機能としては,データベースカーネルが改良され,現在のグラフモデルを表示するSchema Viewerが追加された。
-
YelpがData Pipeline ProjectとData Pipeline Client Libraryの最新版をオープンソース化
Yelpは、データパイプラインイニシアチブで最新コンポーネントとして、Pythonベースのデータパイプラインクライアントライブラリをオープンソース化した。
-
Kuzzle - オンプレミスのドキュメントバックエンド
Kuzzleはオンプレミスまたはクラウドで実行できるドキュメントバックエンドである。このプラットフォームを支える会社が最近、CES2017においてエンタープライズバージョンを発表した。
-
IntelはApache Spark上で動作する分散型ディープラーニングライブラリであるBigDLをオープンソース化
IntelはApache Spark上で動作する分散型ディープラーニングライブラリであるBigDLをオープンソース化した。既存のSparkクラスタを活用して、ディープラーニングの計算を実行し、Hadoopに格納された大量のデータセットからのデータロードを容易にする。
-
AWS re:Inventのまとめ
ラスベガスで毎年開催されるre:Inventカンファレンスにおいて、AWSが、やがて公開されるクラウドサービスを相次いで発表した。Amazonは、パブリッククラウドと一緒に、20数個の新機能について概要を説明した。それには、S3オブジェクトストレージで直接データクエリを実行すること、デプロイメントパイプラインの一部として、コードを構築すること、低価格の仮想プライベートサーバを供給すること、ETLスタイルでまとめてデータを移動することが含まれる。
-
GoogleのBigQueryに新たなパブリックデータセットが追加
Stack Overflowは、そのデータセットをGoogleのBigQueryを通して利用可能となることを最近発表した。開発者は、標準のSQL文を使用して、投稿、投票、タグ、バッジなどのStack Overflowデータ全体を対象にクエリできる。本投稿では、GoogleのBigQueryプラットフォームを通して利用可能なデータをセットを探っていく。
-
Julien Nioche氏が語るStorm Crawler - Apache Stormをベースとするオープンソースのクローラパイプライン
DigitalPebbleのディレクタで,Apache NutchWebクローラプロジェクトのPMCメンバ兼コミッタであるJulien Nioche氏が,StormCrawlerについての講演を行なった。StormCrawlerはストリーミングフレームワークであるApache Stormをベースとした,分散Webクローラ開発のための再利用可能なコンポーネントのコレクションだ。InfoQはプロジェクトの中心的コントリビュータであるNioche氏にインタビューして,StormCrawlerに関する詳細と,同種のテクノロジとの比較について聞くことにした。
-
Facebookによるグラフデータ処理のためのApache GiraphとSpark GraphXの比較
Facebookチームは、既存のGiraphベースのグラフ処理システムと、人気のSparkフレームワークの一部である新しいGraphXとのパフォーマンス比較を先日公開した。彼らの結論はGraphXは現在、彼らのグラフ処理ワークロードをサポートするために十分なスケーラビリティやパフォーマンスを備えていないということだ。
-
Googleが機械学習APIの提供でターゲットを企業に拡大
エンタープライズでのクラウドの利用はここ数年、ビッグプレイヤの最前線にある。Amazon、IBM、Google、Microsoftはエンタープライズユーザとそのニーズに応えるためにサービスを拡大している。Googleはエンタープライズユーザ向けの一連の機械学習サービスを発表した。
-
Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来
Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が,カラム指向データ処理の今後について,Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく,氏にインタビューした。