BT

Kubecon 2017より - GoogleのDavid Aronchick氏に聞く、マシンラーニングとKubernetesに関するQ&A

| 作者: Rags Srinivas フォローする 10 人のフォロワー , 翻訳者 h_yoshida フォローする 1 人のフォロワー 投稿日 2018年2月26日. 推定読書時間: 6 分 |

原文(投稿日:2018/01/24)へのリンク

読者の皆様へ: あなたのリクエストに応じて、大切な情報を見逃すことなく、ノイズを減らす機能を開発しました。お気に入りのトピックを選択して、メールとウェブで通知をもらいましょう

テキサス州オースチンで先日閉幕したKubeconには4,000人を越えるエンジニアが参加し、会場はKubernetesで埋め尽くされていた。マシンラーニングとKubernetesの親和性については、そのワークロードとしての性格と、アルゴリズムのトレーニングに必要となる膨大な計算能力のため、多くのセッションがトピックとして取り上げていた。

Kubeflowは、Kubernetes上でのマシンラーニング開発を容易でポータブル、かつスケーラブルにするプラットフォームである。

  • Jupyterノートブックの作成と管理を行うJupyterHub
  • CPUとGPUの両方に対応するTensorflowトレーニングコントローラ
  • Tensorflowを提供するコンテナ

InfoQは、GoogleのプロダクトマネージャでKubeflowのコントリビュータのDavid Aronchick氏と話す機会を得た。氏はKubecon 2017で、Kubernetesとマシンラーニングのシナジに注目したプレゼンテーションを行っている。

InfoQ: MLはKubeconで多くの注目を集めていたようですが、何か特別な理由があるのでしょうか?

Aronchick: MLがほぼすべての産業のあり方を変えつつある、ということは間違いありません。テクノロジの未来を語る明晰な人たちで溢れた大勢の聴衆を前にするたびに、彼らから最新のトレンドと新たな進歩が広められていくのです。Kubeconの4,000を越える参加者は、マシンラーニングの最先端で他の人たちが何をしているのか、この新たな技術でどのように自らのプロセスを改善できるのかを知りたいと願っている人たちです。

そのような状況ですから、すでにたくさんの新たなプロジェクトが世に現れて、この分野で活発な活動をしています。事実、カンファレンスのトラックがマシンラーニングで埋め尽くされた、という発表もたくさんありました。特に言いたいのは、Kubernetesでのマシンラーニングは未来の話ではない、今ここにあるのだ、ということです。

InfoQ: MLとKubernetresとの間に全般的なシナジというものがあれば、それについて説明して頂けますか?

Aronchick: MLは、今日利用可能になった膨大なデータを活用することで、ビジネスの疑問に対して、より正確な答をかつてない程の速さで提供する、まったく新しい方法です。その一方で、MLソリューションを支えるインフラストラクチャは、非常に複雑なものになることが多い上に、いまだ初期段階に留まっており、独自スクリプトや依存性の分析、互換性といった問題を数多く抱えています。また、MLのスタックは複数の場所(開発、トレーニング、運用) に渡ることも多いため、すべての同期を維持する作業は指数級数的に困難になります。

Kubernetesは、このようなMLプラットフォームの大規模な配置と運用を支援する、共通的なプラットフォームを提供します。複数のクラウド内で動作するリッチなオーケストレーション機能によってKubernetesは、複雑なマルチサービスMLワークロードを容易に配置、運用、管理する手段を、データ科学者や開発者、ITプロフェッショナルに与えてくれるのです。

InfoQ: 例えばHelmのチャート(chart)を使ってKubernetesにMLツールをインストールする場合と比較して、Kubeflowを使用する方法はどのように違うのですか?

Aronchick: MLツールのインストールは、実際にはパッケージシステムを通じて行われます。今のところksonnetを使用していますが、その他にもさまざまなデプロイメント手段をサポートできればと思っています。Kubeflowの価値は、複数のツールを簡単に連動させることができる点にあります。現在はさまざまな選択肢(helm、ksonnetなど)を評価している段階ですが、そのインストールの上にもっとリッチなオブジェクトセットを用意して、関連する多くのパッケージが、特別な作業をしなくてもうまく動作するようにしたいと考えています。

InfoQ: もし私がML/データ科学者であったとしたら、Kubernetesレイヤを導入する難しい方法に代えてKuberflowを使用することで、日常的な業務はどのように簡単になるのでしょう?

Aronchick: Kubernetesはオブジェクトとサービスエンドポイントを提供するので、データ科学者ならば自分の問題 — データ問題の解決に集中することができます。Kubeflowを使うために、データ科学者に複雑なKubernetesのセットアップをして欲しいとは思っていませんし、その必要もありません。ラップトップならばminikubeも使えますし、オンプレミスのクラスタならば、会社が提供するKubernetesのインストールも使用できます。クラウドであれば、プロバイダのホストするKubernetesを使えます。どの場合でも、Kubeflowはコマンドひとつでインストールできて、使い慣れたTensorflowサービスやJupyterノートブックが表示されるようになります。

InfoQ: 他のMLツールキットのサポートをKubeflowに統合する方法について、技術的に詳しく説明して頂けますか?

Aronchick: ネイティブなKubernetesツールを使っているので、既存のデプロイメントパッケージに統合するのはそれほど難しいことではありません。私たちはひとつのコミュニティとして集結して、さまざまな選択肢を提供していますが、他のMLツールキットからも直接的に関与してほしいと思っています。彼らのプラットフォームは、彼らが一番よく知っているからです(現在、ほぼすべてのグループと話し合いを持っています)。次にどのツールキットを追加すべきかについても、Githubリポジトリ上でいくつか議論しています。何にせよ、支援をお願いしたいと思います!

 

InfoQ: コミュニティに対するサポートはどのようになっているでしょう、また、Cloud FoundryやOpenShiftといったプラットフォームも同様にサポートされるのではないかと思うのですが、ロードマップには何が予定されていますか?

Aronchick: KubeflowはKubernetesネイティブですし、今後もそうであるように、私たちは最大限の努力をします。これはつまり、Kubernetes対応であれば、すべてのプラットフォームをサポートする用意があるということです。Cloud FoundryやOpenShiftネイティブなプラットフォームもこれに含まれます(Red Hatはすでにプロジェクトに貢献してくれています)。すでに発表しているように、Cannonical/Ubuntu、Weaveworks、Caicloudなど、多くのプラットフォームプロバイダからもコントリビューションを受けています。私たちはユビキタスなMLスタックの価値を重く受け止めて、データ科学者にとってKubernetesが、必要な時にいつでも使えるものであるようにしたいと思っています。

基調講演などの記録ビデオは、Kubeconのスケジュールページで見ることができる。

 
 

この記事を評価

採用ステージ
スタイル
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

特集コンテンツ一覧

ASP.NET Core - シンプルの力

Chris Klug 2018年6月4日 午前3時26分

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT