相比現有方案,Colossal-AI 團隊聯合百圖生科的這項研究,推理速度最高提升約 11 倍!
近日,Colossal-AI 團隊聯合百圖生科成功加速蛋白質單體與復合物的結構預測,行業內最前沿的同時支持蛋白質單體(Monomer)與復合物(Multimer)結構預測的 xTrimo Multimer 模型已免費開源,相比現有方案,推理速度最高提升約 11 倍!
本次解決方案背后優化加速技術來自 Colossal-AI,這是一個旨在全面助力 AI 大模型工業化應用的通用深度學習系統。xTrimo Multimer 開源版模型通過引入 Colossal-AI 的大模型優化技術,顯著降低蛋白質結構預測模型訓練和推理的時間和經濟成本,提高蛋白質結構預測模型領域的設計和部署效率,是 Colossal-AI 系統在 AI 大模型 & 生物醫藥領域落地應用的重要實踐,使得在該領域訓練和使用更大的模型成為可能。
該項目已在 GitHub 上免費開源
Colossal-AI 是一個面向大模型時代的通用深度學習系統。自開源以來,Colossal-AI 不僅在數個月內獲得近五千顆 Github Star,多次登上 GitHub Trending 榜首,相關解決方案也已成功在生物醫藥、自動駕駛、云計算、零售、芯片等行業知名廠商落地應用,廣受好評。此次攜手百圖生科,利用雙方在高性能計算和生物計算領域上前沿的技術積淀,提出蛋白質單體與復合物的結構預測加速方案,進一步共同打造繁榮的生物計算生態,精準高效地探尋癌癥、衰老等疾病的免疫規律,逐一攻破 AI 技術在靶點挖掘、創新藥物設計落地應用上的難關,讓更多疾病可預警、可控制、可治愈。
眾所周知,蛋白質結構預測是結構生物學領域最為重要的課題之一,也是我們理解基因翻譯和蛋白質功能的重要手段。蛋白質之間的相互作用,是蛋白質發揮生物學功能的重要結構基礎。但是由于蛋白質的多級結構和復雜的相互作用,使得精確預測三維結構這一關鍵問題十分有挑戰性。
近年來,深度神經網絡的成功使得人工智能在各個領域得到了廣泛的應用。自 DeepMind 發布的 AlphaFold 能夠實現根據氨基酸序列精準預測蛋白質結構以來,生命科學領域掀起了使用人工智能預測蛋白結構的熱潮。
AlphaFold 能夠實現端到端的從序列直接預測單體蛋白質三維結構,但在生物體內,多數蛋白質是以復合體的形式來發揮功能的。因此,為了打破 AlphaFold 僅在預測單體蛋白方面表現優異的局限,DeepMind 后來也發布了用于預測蛋白復合體結構的 AlphaFold-Multimer 模型。
早在 2022 年 3 月,Colossal-AI 團隊曾推出蛋白質結構預測模型 AlphaFold 的訓練推理加速方案 FastFold,用更低的成本將總體訓練時間從 11 天減少到 67 小時,在長序列推理應用中實現超 11 倍的提升。以此為起點,Colossal-AI 團隊在蛋白質結構預測領域的技術革命正在延續。
針對蛋白質單體 (Monomer) 與復合物 (Multimer) 結構預測的難題,本次 Colossal-AI 團隊聯合百圖生科提出行業內最新解決方案 xTrimo Multimer 開源版模型,能夠更好地理解蛋白互作關系,從而提升藥物研發平臺中靶點分析、蛋白質結構預測和模擬以及高精準抗體設計等方面的能力。

此外,推理階段昂貴的經濟和時間成本使得 AlphaFold 模型相關的研究和開發十分困難,尤其是面對長序列推理時,計算復雜度和內存消耗都面臨著巨大挑戰。xTrimo Multimer 開源版模型針對 AlphaFold-Multimer 模型中的計算特性,進行了針對性的 CUDA 優化,并且進行了 Kernel Fusion。相較于 AlphaFold2 和哥倫比亞大學的 OpenFold,xTrimo Multimer 開源版模型在單卡推理上性能有明顯提升 ,推理速度分別提高 1.58~2.14 倍和 1.14~2.23 倍。

xTrimo Multimer 開源版模型還支持超長序列的分布式推理。由于使用了動態軸并行(Dynamic Axial Parallelism)技術,xTrimo Multimer 可以高效地將計算和部分顯存分配到不同的設備上,從而解決超長序列面臨的計算和內存挑戰。在 2K 到 3K 的序列長度下,xTrimo Multimer 使用多卡進行推理,相對于 OpenFold 和 AlphaFold 2 推理速度最高提升 8.47 倍和 11.15 倍,對比 Uni-Fold2.0 速度最高提升 4.45 倍。xTrimo Multimer 可以支持長達 4K 的序列推理,此時 OpenFold 和 AlphaFold 2 受限于顯存無法完成推理,而 xTrimo Multimer 可以在 20 分鐘左右完成。

百圖生科首席 AI 科學家宋樂表示:“從對單個蛋白質結構的模擬,到對不同蛋白質之間的相互作用的識別,再到對蛋白質復合物的繪制,百圖生科致力于解碼、建模復雜人體免疫系統,開發突破創新藥物,編程免疫系統,治愈多種免疫相關疾病。此次 xTrimo Multimer 開源版模型的發布,是我們攜手潞晨科技 Colossal-AI 團隊,借助其在高性能計算上的優勢以及百圖生科生物計算領域前沿的技術積淀,朝著百圖生科 xTrimo 多模態生物計算大模型體系邁出的又一步。正如我們一直以來所努力的方向,精準高效地探尋癌癥、衰老等疾病的免疫規律,逐一攻破 AI 技術在靶點挖掘、創新藥物設計落地應用上的難關,讓更多疾病可預警、可控制、可治愈!”
潞晨科技創始人尤洋教授表示:“ 此次 Colossal-AI 團隊與百圖生科合作的蛋白質單體與復合物結構預測最新方案,是面向大模型時代的通用深度學習系統 Colossal-AI 在生物醫藥領域應用落地的重要進展。未來我們雙方將會繼續在生物計算大模型上有更深入的合作,助力深度學習在創新藥物研發上的應用和落地。”
隨著人工智能對各個領域的高度滲透,各行業的智能化產業轉型升級都離不開高性能 AI 的加持,潞晨對于 AI 大模型的高效訓練和推理方案是未來 AI 市場的剛需。Colossal-AI 致力于構建針對 AI 大模型的完整生態系統,針對不同行業的需求提供智能化、一體化的高效靈活解決方案,切實有效解決企業 AI 大模型產品落地的關鍵痛點,為全產業鏈賦能。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。