2月4日 消息:隨著近年來大型語言模型(LLMs)在語言處理領域的顯著進展,研究人員嘗試將這些模型應用于藥物發現,以優化相關任務。然而,在藥物發現的分子優化方面,LLMs并未取得顯著進展。現有方法通常側重于利用數據中提供的化學結構的模式,而忽視了領域專家的反饋和經驗。這在問題上造成了困擾,因為藥物發現流程涉及整合來自領域專家的反饋,以進一步完善流程。
為填補先前工作中的差距,研究人員著重于人機交互,利用強大的LLMs的交互性和通用性。他們發布了MolOpt-Instructions,這是一個用于在分子優化任務上對LLMs進行微調的大型基于指令的數據集。此數據集涵蓋了與分子優化相關的任務,確保了分子之間的相似性約束和性質之間的實質性差異。此外,他們還提出了DrugAssist,這是一個基于Llama-2-7B-Chat的分子優化模型,能夠通過人機對話進行交互式優化。通過這些對話,專家可以進一步引導模型并優化最初生成的結果。
為了評估,研究人員將DrugAssist與兩個先前的分子優化模型和三個LLMs進行了比較,評估指標包括溶解度和BP以及成功率和有效性等。根據結果顯示,DrugAssist在多屬性優化方面持續取得有希望的成果,并在給定范圍內保持了優化的分子性質值。
此外,研究人員還通過案例研究展示了DrugAssist的卓越能力。在零樣本設置下,模型被要求同時將兩個屬性BP和QED的值至少增加0.1,即使在訓練過程中僅暴露于數據,該模型也成功完成了任務。此外,DrugAssist還成功地將給定分子的logP值增加了0.1,即使這個屬性沒有包含在訓練數據中。這展示了模型在零樣本和少樣本設置下的良好可遷移性,使用戶有可能同時結合個別屬性并進行優化。最后,在交互過程中,模型生成了一個不符合要求的分子的錯誤答案。然而,它通過人類反饋糾正了錯誤并提供了正確的響應。
總體而言,DrugAssist是一種基于Llama-2-7B-Chat模型的分子優化模型,能夠實時與人類進行互動。它在單屬性和多屬性優化中展現了出色的結果,表現出很強的可遷移性。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。