InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Googleが概念ベクトルを使用した画像検索を研究
Googleは先頃、医学画像の検索を目的とした、Similar Medical Images Like Yours(SMILY)と呼ばれるツールの開発に関する研究論文を発表した。この研究では、画像検索に埋め込み(embeddings)を使用することで、概念のインタラクティブな洗練(refinement)を通じた、ユーザによる検索への関与が可能になる。
-
Microsoft .NET Conf 2019 - .NET Core 3.0、C# 8.0、F# 4.7、マシンラーニング
今週始めにオンラインストリーミングされた.NET Conf 2019 Editionでは、.NETエコシステムの新機能がいくつか発表されている。.NET Core、ASP.NET、EF Core 3.0、さらにC# 8.0とF# 4.7もリリースされた。これら新リリースは、Windowsデスクトップ、Web、モバイルアプリケーションの開発方法に大きな影響を与えるものだ。Visual Studio 2019の新機能とツールも紹介されている。
-
FacebookとMicrosoftがパートナとともにDeepfake Detection Challengeを発表
Facebook、Microsoft、Partnership on AIは、大学の研究者らと共に、AIで生成した事実でないイメージやビデオを検出可能なAIを開発するコンテストとして、Deepfake Detection Challenge(DDC)を立ち上げた。提案された課題は、DDCの提供するリアルとフェイクの両方のビデオによるデータセットを使用するもので、最高のAIソリューションを構築したチームには表彰と賞金の提供が行われる。
-
Amazonの認証を取得したSyntiant Neural Decision Processors(NDP)により、低消費電力デバイスでのAlexa使用が可能に
Syntiant NDPは、TensorFlowニューラルネットワーク実行に特化したカスタムビルドチップだ。Alexa対応デバイスを含む、さまざまな音声およびオーディオ対応デバイスに組み込むことができる。
-
Agile Igniteを使用した継続的ディープラーニング - Denis Magda氏の講演より
先日のApacheCon North Americaで、Denis Magda氏が、インメモリデータグリッドのApache Igniteを使用した継続的マシンラーニング(continuous machine learning)について講演した。Igniteは、データを格納した同じクラスタ内でトレーニングとホストモデルを実行することで、マシンラーニングパイプラインを簡素化すると同時に、新たなデータが利用可能になった時に"オンライン"トレーニングを実行して、モデルを漸進的に改善することもできる。
-
Jagadish Venkatraman氏、LinkedInのSamza 1.0開発を語る
先日のApacheCon North AmericaでJagadish Venkatraman氏は、LinkedInが大規模なストリーム処理を行うためにApache Samza 1.0を開発した経緯について講演した。その中で氏は、兆単位のイベントと数ペタバイトのデータを抱えるLinkedInのユースケースについて説明し、ステートフル処理、高レベルAPI、柔軟な展開モデルといった、1.0リリースで追加された機能を強調した。
-
pacheCon 2019基調講演 - Google CloudによるKubernetesを使用したビッグデータ処理の拡張
ApacheCon North AmericaでChristopher Crosbie氏が、"Yet Another Resource Negotiator for Big Data? How Google Cloud is Enhancing Data Lake Processing with Kubernetes"と題した基調講演を行った。講演の中で氏が強調したのは、Kubernetesクラスタ内でApacheソフトウェアを動作させるためのコントロールプレーンを提供する、オープンソースのKubernetesオペレータを開発することによって、Apacheのビッグデータソフトウェアを"クラウドネイティブ"にするという、Googleの取り組みについてだった。
-
Open Core Summitを開催する理由 - 発起人のJoseph Jacks氏に聞く
あるソフトウェアがクラウドベースで広く採用されるようになったことがきっかけで、いくつかのオープンソースプロジェクトが、最近になってライセンスの変更を行っている。例えば、Confluentは昨年末、データ転送機能を提供するストリーミングプラットフォームであるConfluent Platfornのコンポーネントの一部と、システムとデータソースを接続するツールのライセンスを変更すると発表した。SaaSプロバイダによる、これらコンポーネントの使用を制限するためだ。
-
GoogleがHadoopのビッグデータワークロード用にCloud Storage Connectorを公開
Googleは先日のブログ記事で、Cloud Strage Connector for Hadoopを新たに発表した。この新機能によって、従来のHDFSをGoogle Cloud Storageに置き換えることが可能になる。ParquetやORCといったカラムナファイル(Columnar file)形式により、スループット向上の実現が期待されると同時に、Cloud Storageディレクトリの分離、低いレイテンシ、並列性の向上、インテリジェントなデフォルト設定といったメリットを享受することができる。
-
Waymoがマシンラーニング用に自動運転車データセットを公開
自動運転テクノロジ企業のWaymoは、5時間以上の運転中に自動運転車が収集したセンサデータを含むデータセットをリリースした。このセットには、いくつかの都市と郊外の環境において、さまざまな運転条件下で収集されたLIDAR(レーザレーダ)およびカメラセンサの高解像度データと、車両、歩行者、自転車、標識のラベルが含まれている。
-
KiloGram - マルウェア検出AIの新たなテクニック
先日、ある研究者のチームが、ファイル内の大きなn-gramを処理することによってマシンラーニングによるマルウェア検出を改善する、新たなアルゴリズムであるKiloGramの論文を発表した。新アルゴリズムは、従来のものよりも60倍高速で、n = 1024以上のn-gramを処理することができる。nの値が大きいことは、解釈可能なマルウェア分析や署名生成において、新たな適用対象を持つことになる。
-
ロボット・ソーシャルエンジニアリング - Brittany Postnikoff氏のQCon New Yorkでの講演より
QCon New Yorkで Brittany Postnikoff氏が、"Robot Social Engineering: Social Engineering Using Physical Robots"と題した講演を行った。学術研究文献から引用した調査結果で氏が示したのは、人は多くの場合において、ロボットを使って操ることができる、ということだ。講演の中心的なメッセージは、ロボットの基本設計の一部としての、セキュリティとプライバシの必要性だ。
-
FacebookがDLRM(Deep-Learning Recommendation Model)をオープンソース公開
Facebook AI Researchは、パーソナライズされたレコメンデーションの生成において最先端の精度を実現するDLRM(deep-learning recommendation model)を、オープンソースとしてリリースすると発表した。GitHubから入手可能なコードには、PyTorchおよびCaffe2フレームワーク用のバージョンが含まれている。
-
FacebookがエンボディドAI進展のためAI Habitをオープンソース公開
Facebookは先日のブログ記事で、仮想ロボットなど具現化されたエージェントの訓練用に設計された人工知能(AI)シミュレーションプラットフォームであるAI Habitatを、オープンソースとして公開することを発表した。この技術を使用したロボットは、隣接する部屋から物体を掴む方法を学習したり、慣れない交通システムで移動する視覚障害者を支援したりすることが可能になる。
-
Celia Kung氏、LinkedInのBrooklinデータストリーミングサービスを語る
LinkedInチームのCelia Kung氏は、先週のQCon New York 2019 Conferenceで、プラグイン可能なソースとデスティネーションをサポートするデータストリーミングサービスであるBrooklinについて講演した。さまざまなデータストアとメッセージングシステムが使用可能になることで、柔軟性と拡張性を備えたソリューションが実現する。Brooklinは、LinkedInで開発されたストリームインフラストラクチャプラットフォームの一部である。