Repurposing Protein Folding Models for Generation with Latent Diffusion

Repurposing Protein Folding Models for Generation with Latent Diffusion

AlphaFold2がノーベル賞を取った後、次に来るのは何か?

答えは「タンパク質の生成」です🧬

PLAIDという新しいAIモデルが登場しました。これまでのAlphaFold2は「タンパク質の形を予測する」ものでしたが、PLAIDは逆に「新しいタンパク質を生み出す」ことができます。

どういうことか?

従来のタンパク質構造予測モデル(AlphaFold2など)は、アミノ酸配列を入力すると3D構造を出力してくれました。PLAIDはその予測モデルの「潜在空間」(AIが学習した特徴の圧縮された表現空間)を学習して、そこからサンプリングすることで新しいタンパク質を生成します。

PLAIDの凄いところ👇

・1D配列と3D構造を「同時に」生成できる
→多くの既存モデルは骨格だけで、側鎖(アミノ酸ごとに異なる部分)は後から追加する必要がありました

・機能や生物種を指定できる
→「人間用に最適化」など、目的に応じた生成が可能

・配列データベースで学習できる
→構造データベースより2〜4桁も大きいデータで学習可能。つまりより多様なタンパク質を学べる

・全原子座標を生成
→実用的な創薬に必要な精度

なぜこれが重要か?

例えば人間に投与する医薬品タンパク質は「ヒト化」する必要があります(免疫反応を避けるため)。PLAIDは生物種を指定できるので、最初から人間向けに最適化されたタンパク質を生成できるわけです。

タンパク質予測から創薬設計へ。AIが「見る」だけでなく「創る」時代が本格化してきました。

#タンパク質生成 #AI創薬 #AlphaFold

http://bair.berkeley.edu/blog/2025/04/08/plaid/