InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
研究者グループが3億件のデータセットを用いてイメージ認識の最先端技術を更新
研究者グループが、一般的に使用されている100万件ではなく、3億件のイメージで構成されたデータセットを対象にトレーニングを行なったモデルを用いることによって、いくつかのベンチマーク結果で最高レベルを更新することに成功した。 データ数を増やした時に何が起きるのかをテストするため、Googleは3億のイメージからなる内部データセットを作成した。データのラベル付けは自動的に行なった。 その結論は、トレーニングデータの多さは有効である、というものだ。
-
GoogleがTensorFlowのためのTensor2Tensorを発表
Google Brainチームは、TensorFlowワークフローコンポーネントをモジュール化するためのユーティリティとラッパーのセットであるTensor2Tensorをオープンソース化した。それは、TensorFlowベースのディープニューラルネットワークプログラムのための移植性と再現性の高い環境を作成するためである。
-
Facebook、Neural Machine Translationに移行
Facebookは最近、NMT (Neural Machine Translation) の世界展開を発表した。2,000以上の翻訳方向と1日45億の翻訳が、フレーズベースの翻訳モデルからNMTに切り替わる。Facebookによると、今回の切り替えによって、よく知られた翻訳スコアであるBLEU スコアは11%上がるという。ここでは、どうやって実現したのか、機械翻訳にとって何を意味するのか、競合に対してどうやっていくのか、説明する。
-
-
eBayのショッピングアシスタントShopBotで実現されたスケーラブルなChatbotアーキテクチャ
eBayのソフトウェアエンジニアであるRobert Enyedi氏がQCon New York 2017 Congerenceで、個人用ショッピングアシスタントアプリケーションであるShopBotについて講演した。Facebook Messengerボットをベースとして2016年にローンチされたShopBotは、AIコンポーネントとeBayのユーザ情報を活用して、会話形式でショッピングの選択肢を提供するアプリケーションだ。
-
EFF(Electronic Frontier Foundation)が人工知能の進捗状況を評価
EFF(Electronic Frontier Foundation)は、複数のタスクを対象とした進化型AI(artificial intelligence)研究を含む文書を立ち上げた。困難なタスクについて進歩を見出すための場所となることが目的だ。メトリクスやデータセット、およびそれらを追跡するためのベンチマークを持たないタスクはたくさんある。EFFは研究者や開発者によるコントリビューションを可能にするためのノートブックを用意した。
-
QCon New York: 機械学習モデルを評価する - 不動産におけるケーススタディ
顧客の住宅売買を支援する不動産会社のOpendoorは、価格モデル向上に機械学習を使用している。同社のデータサイエンティストであるNelson Ray氏がQCon New York 2017 Conferenceで、住宅再販のリスク評価を行なう機械学習モデルの検討を目的とした、シミュレーションベースのフレームワーク開発について講演した。
-
マイクロサービスのデータを管理する
Stitch FixチームのRandy Shoup氏がQCon New York 2017 Conferenceで、マイクロサービスベースのアプリケーションにおけるデータと分離永続化の管理について講演し、マイクロサービスの重要な構成要素としてのイベントにも言及した。
-
GPU Technology ConferenceでGreg Kurtzer氏に聞く。
InfoQのRags SrinivasがGPU Tech Conferenceで、一連のオープンソースのコントリビュータであるGreg Kurtzer氏に話を聞く。
-
GoogleがFacetsをリリース
Googleが、機械学習サイエンティスト向けデータビジュアライゼーションツールFacetsをオープンソース化した。 Facetsの目的は、巨大なデータセットを理解し解釈できるようにすることだ。Facetsは、開発者が巨大なデータセットに含まれるニュアンスや知見を見つける手助けをする。
-
NetflixがGenie 3を発表
Netflixがビッグデータ分散ワークフロー管理ツールでrあるGenie 3の新しい機能を発表した。この新しいバージョンは拡張性がある構成駆動のデータ処理実行とタスクパイプラインをサポートする。
-
Google Cloud Video Intelligenceがパブリックベータに
Googleは、Cloud Video Intelligence APIのベータ版が全員に公開されると発表した。 Video Intelligence APIには2つのことができる。ビデオ内のショット(シーン変化)の決定と、ビデオと個々のショットに対するラベル割り当てだ。APIをパブリックベータにするとともに、Googleはアダルトコンテンツ検出のサポートも追加した。
-
Apache Metronがトップレベルプロジェクトに移行
HortonworksとApacheは、リアルタイム・ビッグデータセキュリティ・プラットフォームのMetronの、ASFトップレベルプロジェクトへの移行を発表した。
-
ディープラーニングとStreet ViewイメージによるGoogle Mapsの改善
GoogleのGround Truthチームは先頃、 Googleマップの改善を目的として、位置情報の画像ファイルから情報を自動的に抽出する、新たなディープラーニングモデルを発���した。このニューラルネットワークモデルは、難易度の高いFSNS(French Street Name Signs)データセットにおいて、高い精度を達成している。
-
Dani Traphagen氏、Apache Igniteで分散システムの次段階へ
GridGainのDani Traphagen氏がOSCON 2017カンファレンスでApache Igniteプラットフォームについて語った。氏は、ディスク(disk)をボトルネックと見なしてメモリのコスト遁減とキャッシュに対する最適化を行うパラダイムシフト、オープンソースプロジェクトApache Igniteを使ったマイクロサービスアーキテクチャのための活用について話した。