香港大學數據智能實驗室主任黃超團隊開發了一款名為 OpenGraph 的圖基礎大模型,專注于在多種圖數據集上進行零樣本預測。該模型通過學習通用的圖結構模式,僅通過前向傳播即可對全新數據進行預測,有效緩解了圖學習領域的數據饑荒問題。
關鍵特點:
強泛化能力:OpenGraph 旨在通過圖結構模式學習,實現對未見數據的零樣本預測。
提示調整技術:團隊提出的提示調整技術提高了模型對新任務的適應性。
GitHub 開源:該工作已在 GitHub 上開源,供學術界和工業界使用和研究。
數據集間 token 差異解決:模型能夠跨不同圖數據集進行預測,解決了數據集間 token 差異的問題。
節點關系建模:在構建通用圖模型時,有效建模節點關系,對模型的擴展性和效率至關重要。
數據稀缺問題的解決:通過大型語言模型進行數據增強,模擬復雜的圖結構關系,提升模型訓練質量。
模型架構:OpenGraph 模型由統一圖 Tokenizer、可擴展的圖 Transformer 和基于大語言模型的知識蒸餾技術三個核心部分組成。
實驗驗證:在多樣化的真實場景數據集上進行測試,涵蓋節點分類和鏈接預測任務,OpenGraph 在零樣本預測中表現優異。
未來工作:團隊計劃增加框架的自動化能力,自動識別噪聲連接,進行反事實學習,并提取圖結構的通用模式,以推動模型的應用范圍和效果。
研究結論:
OpenGraph 作為圖基礎模型構建的初步嘗試,通過在多個標準數據集上的廣泛測試,證明了其出色的泛化性能。研究人員希望借助 OpenGraph 顯著增強模型在零樣本圖學習任務中的泛化能力,并探索多種下游應用。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。