BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Amazonが社内向けマシンラーニングコースを一般公開

Amazonが社内向けマシンラーニングコースを一般公開

原文(投稿日:2020/08/25)へのリンク

Amazonは、同社のMachie Learning Universityコースから、いくつかのビデオと副教材を一般公開した。このコースは、マシンラーニングに関する3つのトピックを扱ったもので、YouTube上でオンデマンドで視聴可能であると同時に、スライドやノートブック、データセットをGitHubからダウンロードすることもできる。年内には、全部で12コースがリリースされる予定である。

Amazonは先日のブログ記事で、このコースのリリースについて発表した。初回のリリースは3つの"accelerated"コースが対象で、いずれもMLの導入から始まって、表形式データや自然言語処理(NLP)、コンピュータビジョン(CV)といった、より専門的なトピックへと進む形式になっている。各クラスのビデオレクチャはYouTubeのプレイリストとしてまとめられており、スライドデッキやデータセット、Jupyterノートブックなどの副教材が専用のGitHubリポジトリで公開されている。年末までには、9つの"in-depth"クラスが追加される予定である。Amazonでは、MLスキルを持ったエンジニアの要求に応えるため、社内向けにMachine Learning University (MLU) を実施している。Amazon Web Services (AWS) の調査研究者であるBrent Werness氏によると、

このクラスを一般公開することで、マシンラーニングのトピックで科学コミュニティに貢献すると同時に、マシンラーニングをもっと一般なものにしたいと考えています。

3つの"accelerated"コースはすべて、3つのレクチャのシリーズとして編成されている。いずれのコースでもニューラルネットワークを取り上げているが、Tabular Dataクラスでは直線回帰や決定木、k近傍モデルなど、比較的"トラディショナル"なMLテクニックを対象とする。表形式データ --- 行と列 --- は、データの世界では広く一般的な形式であるため、このコースでは特徴量エンジニアリング(feature engineering)やモデル評価といったMLの基本の多くに加えて、AutoMLのような、より高度な話題も取り上げている。NLPクラスでもいくつかの基本を紹介しているが、こちらはNLPの最先端モデルである再帰型ニューラルネットワーク(RNN)やTransformerなどを含む、ディープラーニングとニューラルネットワークのすべてを取り上げた講義になっている。CVクラスはほぼ全部がディープラーニングに関するもので、特にAlexNetやResNet、VGGNetといった畳み込みニューラルネットワーク(CNN)が中心である。各レクチャシリーズの最後には、提供されたデータセットを使って自身のマシンラーニングモデルを構築し、評価して、最終プロジェクトを完成することが推奨されている。

教材の大部分はプラットフォーム非依存だが、Amazonのプロダクト、特にAWSサービスへのバイアスの存在は確認できる。例えば、AWSの科学者が指導するNLPとCVの2コースには、コースのノートブックをAWS Sagemakerマシンラーニングサービス上で実行する方法を紹介するビデオが含まれている。また、副教材であるJupyterノートブックのニューラルネットワークコードでは、最も一般的なフレームワークであるTensorFlowやPyTochではなく、AWSがディープラーニングフレームワークとして採用するMXNetが使用されている。

発表に対するHacker Newsでの議論では、あるユーザが次のような発言をしている。

私はAmazonのソフトウェアエンジニアとして、コースのいくつかを受講しましたが、とても有意義なものでした。社内プログラムの目標は、ソフトウェアエンジニアが"マシンラーニングエンジニア"として活動可能なデータサイエンスの知識を習得するように、トレーニングすることにあります。トレーニングを完了したソフトウェアエンジニアは、自身でモデルを実装することや、より可能性が高いものとして、データチームと協力してモデルを製品化することができるようになります。

コースのレクチャビデオはYouTubeで、コースの教材はGitHub上で、それぞれ公開されている。
 

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

BT