BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ

  • Microsoftがドローンとロボットのためのシミュレータ、AirSimをリリース

    MicrosoftがAirSimを開発してオープンソース化した。これは世界各地におけるドローンの飛行をシミュレートするのに使えるツールだ。シミュレータはUnreal Engineで作られており、Microsoftはまもなくロボットや他の種類の車両のサポートを追加する予定だ。

  • Apache HBase 1.3リリースで多数のパフォーマンス改善

    Apache HBase 1.3.0は、2017年1月中旬にリリースされた。今回のリリースでは、日付ベース階層圧縮がサポートされ、ログ先行書き込み(WAL)や新しいRPCスケジューラなど複数箇所で改善があった。このリリースには、合計で約1,700件の解決済みのissueが含まれている。

  • MindMeldの対話型アプリケーション構築ガイド

    対話型(会話型)AI企業のMindMeldが、対話型アプリケーションを作成するための課題と手順を説明した「The Conversational AI Playbook」を公開した

  • 話題満載のQCon London 2017 ,Jonas Boner,Sachine Kulkami,Martin Thompson氏らが講演

    QCon London 2017まであと50日となった。11年目を迎え,栄えあるQueen Elizabeth II Conference Centerで3月6~8日に開催される技術会議に向けて,チケットの売れ行きも好調だ。

  • Neo4j 3.1がリリース - Causal Clusteringをサポート,セキュリティを強化

    NoSQLグラフデータベースNeo4jの最新バージョンには,Causal Clustering(因果クラスタリング)と新たなセキュリティアーキテクチャが導入されている。Neo4jチームは先頃,同グラフデータベースのバージョン3.1をリリースした。その他の機能としては,データベースカーネルが改良され,現在のグラフモデルを表示するSchema Viewerが追加された。

  • YelpがData Pipeline ProjectとData Pipeline Client Libraryの最新版をオープンソース化

    Yelpは、データパイプラインイニシアチブで最新コンポーネントとして、Pythonベースのデータパイプラインクライアントライブラリをオープンソース化した。

  • Kuzzle - オンプレミスのドキュメントバックエンド

    Kuzzleはオンプレミスまたはクラウドで実行できるドキュメントバックエンドである。このプラットフォームを支える会社が最近、CES2017においてエンタープライズバージョンを発表した。

  • IntelはApache Spark上で動作する分散型ディープラーニングライブラリであるBigDLをオープンソース化

    IntelはApache Spark上で動作する分散型ディープラーニングライブラリであるBigDLをオープンソース化した。既存のSparkクラスタを活用して、ディープラーニングの計算を実行し、Hadoopに格納された大量のデータセットからのデータロードを容易にする。

  • AWS re:Inventのまとめ

    ラスベガスで毎年開催されるre:Inventカンファレンスにおいて、AWSが、やがて公開されるクラウドサービスを相次いで発表した。Amazonは、パブリッククラウドと一緒に、20数個の新機能について概要を説明した。それには、S3オブジェクトストレージで直接データクエリを実行すること、デプロイメントパイプラインの一部として、コードを構築すること、低価格の仮想プライベートサーバを供給すること、ETLスタイルでまとめてデータを移動することが含まれる。

  • GoogleのBigQueryに新たなパブリックデータセットが追加

    Stack Overflowは、そのデータセットをGoogleのBigQueryを通して利用可能となることを最近発表した。開発者は、標準のSQL文を使用して、投稿、投票、タグ、バッジなどのStack Overflowデータ全体を対象にクエリできる。本投稿では、GoogleのBigQueryプラットフォームを通して利用可能なデータをセットを探っていく。

  • Julien Nioche氏が語るStorm Crawler - Apache Stormをベースとするオープンソースのクローラパイプライン

    DigitalPebbleのディレクタで,Apache NutchWebクローラプロジェクトのPMCメンバ兼コミッタであるJulien Nioche氏が,StormCrawlerについての講演を行なった。StormCrawlerはストリーミングフレームワークであるApache Stormをベースとした,分散Webクローラ開発のための再利用可能なコンポーネントのコレクションだ。InfoQはプロジェクトの中心的コントリビュータであるNioche氏にインタビューして,StormCrawlerに関する詳細と,同種のテクノロジとの比較について聞くことにした。

  • Facebookによるグラフデータ処理のためのApache GiraphとSpark GraphXの比較

    Facebookチームは、既存のGiraphベースのグラフ処理システムと、人気のSparkフレームワークの一部である新しいGraphXとのパフォーマンス比較を先日公開した。彼らの結論はGraphXは現在、彼らのグラフ処理ワークロードをサポートするために十分なスケーラビリティやパフォーマンスを備えていないということだ。

  • Googleが機械学習APIの提供でターゲットを企業に拡大

    エンタープライズでのクラウドの利用はここ数年、ビッグプレイヤの最前線にある。Amazon、IBM、Google、Microsoftはエンタープライズユーザとそのニーズに応えるためにサービスを拡大している。Googleはエンタープライズユーザ向けの一連の機械学習サービスを発表した。

  • Julien Le Dem氏に聞く - Apache Arrowが示すカラム指向データ処理の未来

    Apache ArrowプロジェクトでPMCのリーダを務めるJulien Le Dem氏が,カラム指向データ処理の今後について,Data Eng Conf NYでプレゼンテーションを行なった。Apache Arrowはカラム型インメモリデータベースのオープンソース標準である。InfoQはParquetとの違いを確認すべく,氏にインタビューした。

  • Spotifyでの大規模な実験

    A/Bテストの試行回数を増やして同時に多数の実験をしたい場合、自分たちのプロセスとプラットフォームに適応する必要があり、これは、文化にも影響を及ぼす可能性がある。制御された実験でプロダクトの研究をすることで実際に顧客がどのようにプロダクトを使っているかについてのアイディアをぶつけ、これらのアイディアがユーザーの振る舞いに影響を与えるかどうかをチェックできる。

BT