使用CARBonAra進行序列預測(示意圖)。圖片來源:瑞士洛桑聯邦理工學院
瑞士洛桑聯邦理工學院推出了一款名為CARBonAra的創(chuàng)新人工智能(AI)模型,該模型能夠依據不同分子環(huán)境中的主鏈結構限制,精確預測蛋白質序列,預示著蛋白質工程以及醫(yī)學和生物技術等多個領域將迎來重要突破。這一研究成果已刊登在《自然·通訊》雜志的最新一期中。
CARBonAra的訓練數據集包含約37萬個亞基,此外還從蛋白質數據庫中選取了10萬個亞基用于驗證,7萬個亞基用于測試。
該模型基于團隊之前開發(fā)的蛋白質結構轉換器框架,利用幾何轉換器這一深度學習模型來處理點與點之間的空間關系(如原子坐標),從而學習并預測復雜結構。CARBonAra的一大特色是其對“上下文”的感知能力,尤其在提升序列恢復率方面表現出色。
當CARBonAra納入分子“上下文”信息,如蛋白質與其他蛋白質、核酸、脂質或離子之間的界面時,其序列恢復率得到了顯著提高。
CARBonAra不僅在合成基準測試中展現出卓越表現,還通過實驗驗證證明了其在蛋白質工程中的靈活性和準確性,為未來藥物發(fā)現提供了新的工具。其在酶工程中的成功應用也顯示出巨大的工業(yè)應用潛力。