Google DeepMindは、AlphaGenome、遺伝子変異がゲノム全体の遺伝子調節にどのように影響するかを予測する新しいAIモデルのリリースを発表した。これは、単一の汎用アーキテクチャで塩基対レベルの解像度を持つ長距離の配列コンテキストを統合することにより、計算ゲノミクス分野で大きな進歩を示している。
AlphaGenomeは一度に最大100万塩基対のDNAを処理し、遺伝子発現、クロマチンアクセシビリティ、転写開始部位、RNAスプライシング、タンパク質結合など、数千の分子モダリティにわたる高解像度の予測を出力できる。これにより研究者はタンパク質コード領域だけでなく、ヒトゲノムの98%を占めるはるかに複雑な非コード調節領域における一般的変異や希少変異の影響を評価できるようになる。
技術的には、AlphaGenomeは局所的な配列モチーフ検出には畳み込みニューラルネットワーク(CNN)を、長距離相互作用のモデル化にはトランスフォーマーを組み合わせ、ENCODE、GTEx、4D Nucleome、FANTOM5といった多様なマルチオミクスデータセットで訓練されている。このアーキテクチャは広範なゲノムベンチマークにおいて最先端のパフォーマンスを達成し、変異効果予測26の評価のうち24でタスク特化モデルを上回る。
注目すべきイノベーションはAlphaGenomeがRNAスプライスジャンクションを直接モデル化できる能力で、これはスプライシングエラーに起因する多くの遺伝性疾患の理解に不可欠である。モデルは組織や細胞タイプごとに変異の制御的影響を定量化する-疾患関連遺伝子の研究およびゲノムワイド関連解析(GWAS)の解釈における重要な能力-ために、変異配列とリファレンス配列を比較できる。
トレーニング効率も向上した:AlphaGenomeの完全モデルは最適化されたアーキテクチャとデータパイプラインのおかげで、DeepMindの初期Enformerモデルの半分のコンピュータ予算で、TPU上でわずか4時間でトレーニングされた。
このモデルは現在、非営利研究利用向けにAlphaGenome APIを通じて利用可能であり、科学者が異なるツールやモデルを組み合わせることなく、大規模な機能仮説を生成できるようにしている。DeepMindは、新しい種、タスク、およびファインチューニングされた臨床応用への拡張計画を示している。
このリリースは医療AIの解釈可能性と感情的背景に関する広範な議論とも一致している。AIアライメント研究者 Graevka Suvorov氏はコメントした:
MedGemmaの真のフロンティアは診断精度だけでなく、患者に与える情報的および心理的状態です。コンテキストのない診断は恐怖を生むデータポイントです。明確に伝えられた診断は治癒への第一歩です。真の「情報的ベッドサイドマナー」を持つAI-画像だけでなく人の全体的な現実を理解している-がAGIの次の本当の飛躍です。
AlphaGenomeはこのビジョンを推し進め、ゲノムのより深くより正確な解釈を可能にし、シーケンスレベルで生物学を理解するための統一モデルを提供する。