2020年のAssociation for Computing Machinery(ACM) Gordon Bell Prizeは、米国と中国の機関からの研究者チームによる、"Pushing the limit of molecular dynamics with ab initio accuracy to 100 million atoms with machine learning"と題されたプロジェクトに与えられた。このプロジェクトでは、新たなマシンラーニングプロトコルであるDeep Potential Molecular Dynamics(DPMD)を導入することにより、1日当たり1億個を越える原子の軌道を1ナノ秒以上にわたってシミュレート可能にしている。
分子動力学(Molecular Dynamics)は、一定時間内の原子の動作と相互作用を分析するコンピュータシミュレーション技法である。ひとつの細胞のような小さなシステムやガス星雲のような巨大かつ複雑なシステムに対して科学者たちは、分子動力学シミュレーションを用いることで、これら分子化合物が時間の経過とともにどのように動作するかを理解する。この分野では、最も正確であると証明されているという理由から、ab initio分子動力学法と呼ばれるシミュレーション方法が50年以上にわたって使用されてきた。ab initio法(ラテン語で"第1原理"の意味)は、シミュレーションにおいて高い精度を達成する反面、膨大な計算リソースを必要とするアプローチであることから、最大でも数千程度を限度とする小規模なシステムに適用対象が限られていた。
DPMDを開発したチームは、ab initio法の限界についてこの論文で詳説し、電子的自由度の数に関して3次元的にスケーリングすることを確認している。一般的に、ab initio法で達成できる空間的および時間的スケールは、100原子および10ピコ秒までである。ab initioは立方スケール(cubic-scaling)法則にほぼ完全に従っているため、複雑な化学反応、化学電池、ナノ結晶材料、放射線損傷といった処理を行うのは、世界最大のスーパーコンピュータをもってしても不可能なのだ。
DP[Deep Potential]モデルの精度は、高次関数を近似する独自のディープニューラルネットワーク(DNN)の能力、対照性制約など物理的要件の適切な処理、関連する構成空間内において精度の均一性が保証されたコンパクトなトレーニングデータセットを生成するコンカレントな学習スキームといったものに由来しています。
DPMDチームは、計算およびコミュニケーションタスクのほぼすべての実行に、世界で2番目に高速なスーパーコンピュータであるIBMのSummitシステム上のGPUを使用することにしたが、Deep Potentialモデルに内在する計算粒度のサイズ制限により、GPUのみに大きく依存するのは非効率であると思うに至った。そこで、埋め込みマトリクスの計算におけるブランチ回避を目的とした近傍リストの新たなデータレイアウト、新たなデータ構造の要素を64bit整数値に圧縮することによるTensorFlowカスタムオペレーションのGPU最適化改善、Deep Potentialモデル用の混合精度演算の開発など、アルゴリズム面でのイノベーションによって、GPUに関連する非効率性の最適化を可能にしたのだ。これらの改善によって研究者らは、前例のないサイズと時間スケールのシミュレーションを、ab initioと同程度の精度で行うための扉を開いたことになる。
Gordon Bell Prizeはハイパフォーマンスコンピューティングの達成を認めるもので、そのファイナリストたちは、自身のアルゴリズム世界で最もパワフルなスーパーコンピュータにスケールアップ可能であることを実証しなければならない。GPU Deep MD-KitはSummitスーパーコンピュータをすべての面で効率的にスケールアップしており、倍精度で91PFLOPS、単精度/半精度混合では162/275PFLOPSを達成している。この成果は、次世代スーパーコンピュータに対して、マシンラーニングと物理モデリングのより優れた統合という課題をもたらすことになる。