首頁 > 云計算頻道 > 大模型

魔搭社區開源多模態對齊統一框架OneLLM

2023年12月22日 16:13:19 來源：站長之家

　　OneLLM 是一種多模態對齊的統一框架，它使用通用編碼器和統一的投影模塊與 LLM(Large Language Model)對齊多模態輸入。OneLLM 還通過使用 modality tokens 實現了在不同模態之間的切換。

　　OneLLM 的核心組件包括多模態 token 的 tokenizer、通用編碼器、統一的投影模塊和大語言模型。

　　多模態 token 的 tokenizer 將輸入的各種模態信號轉換為 token 序列，以便進行后續處理和對齊。

　　通用編碼器是在 LAION(Language and AI ON)平臺上訓練的 CLIP VIT Large 模型，它具有強大的語義理解能力，可以對多模態輸入進行編碼。

　　統一的投影模塊(UPM)是將各個模態的輸入投影到 LLM 的 embedding 向量空間中，以實現多模態的對齊。UPM 由 K 個投影專家組成，每個專家包含多個 transformers 塊和大量的參數。

　　大語言模型是 OneLLM 采用的開源 LLaMA2-7B 模型，它在大規模文本數據上進行了預訓練，可以對輸入進行更深入的語義理解和生成。

　　OneLLM 支持多種不同模態數據的理解，包括圖像、音頻、視頻、點云、深度 / 法線圖、IMU 和 fMRI 大腦活動。

　　實驗證明，OneLLM 在視頻 - 文本、音頻 - 視頻 - 文本、音頻 - 文本等任務中優于現有方法，表現出了較強的零樣本能力。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

一加Ace 6T官宣：全球首發驍龍8 Gen5

真我GT8 Pro阿斯頓馬丁F1限量版開售，16GB+1TB售價5499元

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

魔搭社區開源多模態對齊統一框架OneLLM

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

魔搭社區開源多模態對齊統一框架OneLLM

擴展閱讀

最新新聞

熱門新聞