本周谷歌DeepMind聯合創始人兼首席執行官Demis Hassabis憑借AlphaFold系列模型拿下諾貝爾化學獎,創造了AI大模型首次拿下諾獎的歷史。
尤其是最新發布的AlphaFold-3在生物分子結構、蛋白-配體結構、生物復合體等方面獲得了很大提升,可顯著加速人類對新藥物的研發進程。
但AlphaFold-3模型是閉源的,并且在使用方面對于一些國家/地區也存在限制。所以,AI研究團隊Chai開源了類似的多模態分子結構預測模型Chai-1。
雖然最近兩年很多大模型也能預測蛋白質結構,但在多聚體預測或蛋白質 - 配體相互作用等方面的表現并不理想。
這是因為蛋白質多聚體的結構和相互作用非常復雜,涉及到多個蛋白質分子之間的精確排列和相互作用。使得模型在處理這種復雜性時可能存在困難,難以準確捕捉到多聚體中各個蛋白質分子之間的微妙相互作用和空間關系。
例如,多聚體中蛋白質分子的相對取向、結合位點的精確位置以及分子間的動態變化等因素對于其功能和活性至關重要,但現有的大模型可能無法充分考慮這些因素,導致預測結果不夠準確。
而Chai-1的模型架構充分考慮了蛋白質多聚體的復雜性,使用了多種先進的技術來提高對多聚體結構和相互作用的預測能力。
在模型架構方面,Chai -1通過引入來自大型蛋白質語言模型的殘基級嵌入,能夠更好地捕捉蛋白質序列中的信息,從而提高在單序列預測方面的能力。使得模型在處理缺乏多序列比對信息的情況時,仍然能夠準確預測蛋白質的結構。
Chai -1還添加了約束特征,包括口袋約束、接觸約束和對接約束等。這些約束特征能夠模擬實驗中觀察到的蛋白質與其他分子之間的相互作用,幫助模型更準確地捕捉多聚體中各個蛋白質分子之間的微妙相互作用和空間關系。
例如,口袋約束可以指定蛋白質口袋與配體之間的距離限制,接觸約束可以模擬蛋白質分子之間的接觸情況,對接約束可以幫助模型確定蛋白質分子的相對取向。
此外,Chai -1在處理多聚體中蛋白質分子的相對取向時,能夠利用其強大的計算能力和優化算法,對各種可能的取向進行全面的搜索和評估,從而找到最優的取向組合。
對于結合位點的精確位置,Chai -1通過對大量訓練數據的學習,能夠識別出微小的結構特征和化學信號,從而更準確地確定結合位點的位置。
同時,Chai -1還能夠模擬分子間的動態變化,考慮了蛋白質分子的柔性和運動性,通過引入動態模型或采用機器學習算法來捕捉分子間的動態相互作用,從而更好地預測多聚體在不同條件下的結構和功能。
根據測試數據顯示,Chai -1僅根據蛋白質序列和配體的化學組成,實現了77%的配體 RMSD 成功率,與 AlphaFold3的76%相當;
在一個包含268個界面、跨越129個結構的評估集中,Chai-1無論是使用或不使用多重序列比對,在單序列模式下在抗體-蛋白的預測上顯著優于AlphaFold2.3。這表明Chai-1在處理抗體這類高度變異的免疫蛋白質序列時快速且準確率非常高。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。