傳統方法的局限性是什么?
傳統蛋白質設計方法的局限性:
基于物理的傳統方法,例如羅塞塔,面臨計算難度,因為需要計算所有可能結構的能量,包括不需要的寡聚態和聚合態。
-
設計目標與顯式優化之間缺乏一致性通常需要進行自定義才能生成可正確折疊的序列。
-
在限制范圍方面可能會出現歧義,例如在蛋白質表面放置疏水氨基酸。傳嚴重依賴人類專家的判斷和專業知識,這使它們變得主觀,并可能限制其穩健性?。
-
傳統方法(例如原生序列恢復)中使用的計算機指標可能與正確的折疊不相關,并且可能對晶體學分辨率敏感。
在蛋白質設計模型的訓練過程中引入噪聲的作用
因為帶噪聲的模型更關注整體拓撲特征,例如整體極性-非極性序列模式,而不是局部結構細節。例如,使用0.3-?噪聲訓練的模型生成的序列,其AlphaFold預測在真實結構的lDDT-Ca(14)為95.0和90.0的情況下,比未加噪聲或輕微加噪聲的模型多兩到三倍(圖2C;使用更高水平的噪聲進行訓練增加了對較寬松lDDT截斷的成功率)。在蛋白質設計計算中,使用更多噪聲訓練的模型具有生成更強烈映射到目標結構的序列的優勢,通過預測方法(這增加了設計通過基于預測的篩選器的頻率,相應地也可能增加達到所需目標結構的折疊頻率)