InfoQ ホームページ MachineLearning に関するすべてのコンテンツ
-
データサイエンスコミュニティのCOVID-19パンデミックへの対応
データサイエンスコミュニティは、COVID-19パンデミックへの勢いに反応しており、データ指向の観点からの多数の記事を提供している。そして、データへのアクセスを提供し、世界中の産業界、学界、政府機関を横断して危機に対処するためにML技術を利用する、公式の活動と草の根的な活動の両方の取り組みをしている。
-
DatabricksがMLflow機械学習プラットフォームをLinux Foundationに提供
ビッグデータ処理および分析エンジンApache Sparkを背景として生まれた会社であるDatabricksは、オープンソースの機械学習プラットフォームMLflowをLinux Foundationに提供している。この発表は、グローバルなバーチャルイベントとして開催された直近のSpark AI Summit 2020 Conferenceで行われた。
-
GoogleがCompute Engine A2 VMでクラウド初のNIVIDIA Ampere A100 GPUをローンチ
先日のブログ記事でGoogleは、NVIDIA Ampere A100 Tensor Core GPUをベースとした、Accelerator-Optimized VM(A2)ファミリをGoogle Compute Engineに導入することを発表した。A2は単一VMで最大16GPUを提供する、パブリッククラウドとしては初のA100ベースのサービスである。
-
Google ML Kit SDKがオンデバイスの機械学習にフォーカス
Googleはスタンドアロンモードで動作することを目的とした新しいML Kit SDKを導入した。以前のML Kit SDKのようなFirebaseとの緊密な統合を必要としない。また、画像のラベル付けとオブジェクトの検出と追跡のために、デフォルトモデルをカスタムモデルに置き換えるための限定的なサポートも提供する。
-
OpenAIが1,750億のパラメーターを持つGPT-3 AI言語モデルを発表
OpenAIの研究者チームは最近、1,750億のパラメーターを備えた自然言語のディープラーニングモデルであるGPT-3を説明する論文を発表した。これは、前のバージョンのGPT-2の100倍である。モデルは約5兆語で事前トレーニングされており、微調整することなくいくつかのNLPベンチマークで最先端のパフォーマンスを実現する。
-
Google AIがCOVID-19の文献調査を支援するNLU搭載ツールを発表
Google AIはCOVID-19 Research Explorerをリリースした。これは、COVID-19 Open Research Dataset上にセマンティック検索インターフェースとして提供される。これにより、科学者と研究者がデータセットのすべての雑誌論文と前刷りを効率的に分析できるようになる。
-
OpenAIがニューラルネットワークを理解するためのビジュアライゼーションツールであるMicroscopeを紹介
OpenAIはMicroscopeをリリースした。これは、すべての重要なレイヤーと8つの主要なコンピュータービジョン(CV)モデルのニューロンのビジュアライゼーションである。これらのモデルは、解釈可能性に関してよく研究されている。このツールは、研究者がこれらのCVモデルを駆動するニューラルネットワークの内部に形成される機能やその他の重要な属性を分析するのに立つ。
-
MicrosoftのZeRO-2がAIトレーニングを10倍高速に
Microsoftは、クラスタサイズに対してスーパーリニアにスケールする、分散ディープラーニング最適化アルゴリズムZero Redundancy Optimizerのバージョン2(ZeRO-2)をオープンソースとして公開した。同社はZeRO-2を使用して、1,000億パラメータの自然言語処理(NLP)モデルを、従来の分散ラーニング技術の10倍の速度でトレーニングすることに成功している。
-
AWSがAmazon CodeGuruの一般提供発表
最近AWSは、機械学習を利用した開発者向けツールであるAmazon CodeGuruの一般提供を発表した。 コードの品質を改善し、アプリケーションの最も高価なコード行を識別するためのインテリジェントなリコメンドを提供する。
-
Facebook、プログラム言語間のコード変換を行うTransCode AIを発表
Facebook AI Researchは、教師なし(unsupervised)ディープラーニングを使用して、プログラミング言語のコードを別のプログラミング言語に変換するシステムであるTransCoderを発表した。TransCoderは280万以上のオープンソースプロジェクトを使用してトレーニングされており、ルールベースの手法を用いた既存のコード変換システムを能力的に凌駕する。
-
COVID-19とAI - 来を語るカンファレンスがスタンフォードで開催
Stanford Institute For Human-Centered Artificial IntelligenceはCOVID-19に対して、さまざまな側面からアプローチしている。
-
Concurnas - 並列およびGPUコンピューティングのための新しいJVM言語
Concurnasは、並行分散システムの構築を目的として設計された、オープンソースのJVMプログラミング言語だ。オブジェクト指向、関数型、リアクティブなプログラム構造を特徴とし、静的に型付けされている。GPUコンピューティングのネイティブサポートとベクトル化機能を供えたConcurnasは、マシンラーニングアプリケーションやハイパフォーマンスな並行アプリケーションの開発を可能にする。
-
Audiが自動運転用データセットをリリース
Audiの研究陣は、自動運転車のためのAudi Autonomous Driving Dataset(A2D2)をリリースした。同データセットには、カメライメージ、LiDARポイントクラウド、車両制御情報に加えて、教師あり学習(supervised learning)用にセグメント化とラベル付けされた40,000以上のフレームが含まれており、商用での利用も可能である。
-
GitHubがMLベースの“Good First Issues”レコメンデーションをリリース
GitHubは、"good first issues feature"の最新バージョンの提供を開始した。これは、マシンラーニング(ML)モデルが"easy"と特定したイシューと、プロジェクトメンテナが選択して"easy"とラベル付けしたイシューのリストとを組み合わせたものだ。オープンソースのコントリビュータならば、経験の深浅を問わずに、この機能を使ってプロジェクト内の簡単なイシューを見つけ、対処することができる。
-
PyTorch 1.4リリースがJavaバインディングと分散トレーニングをサポート
Facebookがオープンソースとして公開するディープラーニングフレームワークのPyTorchが、バージョン1.4のリリースを発表した。Python 2をサポートする最終バージョンになる予定の今回のバージョンでは、分散トレーニングとモバイル推論が改善され、Javaサポートが導入されている。