AlphaCode：ディープラーニングによる競争力のあるコード合成

原文(投稿日：2022/03/02)へのリンク

AlphaCodeを使った競争力のあるコード生成というタイトルの新しい研究で、目標指向のコード合成に関して有望な結果が示されており、ディープsequence-to-sequenceモデルが使われている。それは以前のネットワーク（Codex、GPT-Neoなど）を拡張しており、CodeContestsという名前の新しいデータセットをリリースしている。これは、将来の研究ベンチマークに貢献するためである。

ディープトランスフォーマーベースのシーケンス処理は、言語タスクから分子生物学研究まで多くのアプリケーションで産業界と学界に確固たる基盤を確立している。転送学習能力が高いため、事前トレーニングレシピによって、検索エンジン、翻訳サービス、チャットボットが強化される。AlphaCodeは、競技プログラミングへの適用のための概念実証を提供することを目的としている。この取り組みは、タスクベースのプログラム生成のためにシーケンスモデルを活用する研究活動が増加している中の一部である（例：数値データサイエンス問題ソルバーJuPyT5）。

AlphaCodeには、マルチクエリアテンションモジュールを備えたさまざまな深さ（つまり、3億から410億のパラメータ）で、いくつかのトランスフォーマーアーキテクチャが含まれている。このアーキテクチャは、エンコーダとデコーダにそれぞれ1536と768の入力トークンを持つ非対称のエンコーダとデコーダのペアで構成されている。ネットワークは選択されたGithubオープンソースコードリポジトリ（715 GB）で事前トレーニングされている。その際、デコーダーでのクロスエントロピー損失とエンコーダー側でのマスクされた言語モデリング損失が使用されている。トレーニング中に使用されるトークンは、SentencePieceトークナイザーによって生成される。最終的な微調整は、提案されたCodeContestsデータセットを使って実行される。モデルのパフォーマンスを実際のプログラマーのパフォーマンスと比較するために、いくつかのCodeforcesチャレンジを使用する。結果は、AlphaCodeが異なる10のコンテストで、平均ランキングが上位54.3％に到達できたことを示している。

トランスフォーマーでモデル化できる言語理解に加えて、競技プログラミングは、入出力解析や計算効率などの選択された課題の制限により、さらに複雑になる。一般的なライブラリ/フレームワークリポジトリとは異なり、競技プログラミングコードリポジトリは比較的少なく、微調整ステップで利用可能なデータソースが制限される。予測を改善するために、AlphaCodeの出力がサンプリング、フィルタリング、クラスター化されて、タスクごとに可能な限り最良の候補が選別される。

この研究は、ディープネットワークを使ったプログラム合成に関して、初の有望なものとなるが、それでも実際の使用にはほど遠いため、より大きなデータセットが必要になる。

AlphaCodeで生成されたものの例は、公式Webサイトで閲覧できる。関連するDeepMindのブログ投稿も興味があればご覧ください。

作者について

Sabri Bolkar

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco

AlphaCode：ディープラーニングによる競争力のあるコード合成

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。