国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    蘋果多模態模型大升級!文本密集、多圖理解,全能小鋼炮

    2024年10月14日 09:37:29 來源:​新智元公眾號

      近日,一向畫風精致的「蘋果牌AI」,也推出了升級版的多模態大模型,從1B到30B參數,涵蓋密集和專家混合模型,密集文本、多圖理解,多項能力大提升。

      多模態大語言模型(MLLM)如今已是大勢所趨。

      過去的一年中,閉源陣營的GPT-4o、GPT-4V、Gemini-1.5和Claude-3.5等模型引領了時代。

      而開源MLLM也同樣在蓬勃發展,LLaVA系列,InternVL2,Cambrian-1和Qwen2-VL的強勁表現,讓作為老大哥的GPT-4o時常躺槍。

      開源與閉源之間差距縮小,兼具單圖、多圖、視頻理解能力的MLLM也成為大家研究的重點。

      說到潮流,怎么能沒有蘋果的一席之地?

      近日,一向畫風精致的「蘋果牌AI」,也推出了升級版的多模態大模型——MM1.5。

      論文地址:https://arxiv.org/pdf/2409.20566

      MM1.5以前代MM1模型為基礎,采用數據為中心的方法進行訓練,顯著增強了文本密集型圖像理解、視覺指代和定位、以及多圖像推理的能力。

      MM1.5系列的參數量從1B到30B,涵蓋密集和專家混合(MoE)模型,即使較小的尺寸也有優異的表現。

      具體來說,MM1.5提升了OCR(光學字符識別)能力,支持任意圖像長寬比和高達4M像素的分辨率,并且擅長理解富含文本的圖像。

      在強大而細粒度的圖像理解能力加持下,MM1.5能夠超越文本提示來解釋視覺內容,例如點和邊界框。

      研究人員還通過對額外的高質量多圖像數據進行監督微調(SFT),進一步提高了模型的上下文學習和開箱即用的多圖像推理能力。

      本文作者重點關注兩種小規模的MLLM,包括1B和3B的密集模型與MoE模型,其中小尺寸的密集模型可以輕松部署在移動設備上。

      「小模型」也符合蘋果一貫的作風,在自家的各種設備上,能夠更好地與用戶場景(如隱私和安全性)融為一體。

      之前微軟和蘋果的很多實踐也證明了,利用高質量數據和先進的訓練策略,小個子的模型在各種下游任務中同樣表現強勁,足以超越大尺寸的模型。

      當然了,光是小還不夠,通用性更為重要。

      MM1.5系列模型在30B參數的范圍之內,都能很好地符合縮放定律,模型越大,性能越強。

      另一方面,研究人員以MM1.5為基礎,微調出服務于視頻理解的MM1.5-Video,以及為移動UI(比如iPhone屏幕)理解定制的MM1.5-UI。

      模型構建

      MM1.5保留了與MM1相同的模型架構,并將改進的努力集中在以下幾個關鍵方面:

      持續的預訓練

      作者在SFT階段之前引入了一個額外的高分辨率連續預訓練階段,這對于提高富含文本的圖像理解性能至關重要。

      作者探索了用于持續預訓練的富含文本的OCR數據,重點關注圖像中文本的詳細轉錄,還嘗試了高質量的合成圖像字幕。

      SFT

      混合中的每一類SFT數據如何影響最終模型的性能?特別是支持每種功能的數據對其他功能有何影響,作者對此進行了廣泛的消融實驗。

      動態高分辨率

      對于高分辨率圖像編碼,作者遵循流行的任意分辨率方法,將圖像動態劃分為子圖像,并進行徹底的消融以細化設計中的關鍵細節。

      為了保留前代模型的零樣本和少樣本學習能力,并更有效地將它們轉移到SFT階段,在開發MM1.5時,研究人員通過探索純文本數據的影響,并優化不同預訓練數據類型的比例,來進一步擴展MM1的預訓練。

      這種方法提高了知識密集型基準測試的性能,并增強了模型整體的多模態理解能力。

      如上圖所示,模型訓練包含三個階段:

      在每個階段,都需要確定最佳數據組合并評估每種數據類型的影響。

      消融實驗設置

      在消融研究中遵循以下默認設置:

      靜態圖像分割通過4個子圖像分割(加上一個概覽圖像)來實現,并且每個子圖像通過位置嵌入插值調整為672×672分辨率。為了加快實驗迭代速度,在消融過程中沒有使用動態圖像分割。

      對于多圖像數據的編碼,僅當當前訓練樣本包含少于三幅圖像時才啟用圖像分割,以避免序列長度過長。

      如下圖所示,模型可以以引用坐標和邊界框的形式,解釋對輸入圖像中的點和區域的引用。

      MM1.5采用與前代相同的CLIP圖像編碼器和LLM主干網絡,并以C-Abstractor作為視覺語言連接器。

      對于連續預訓練和SFT,作者將批量大小設置為256。使用AdaFactor優化器,峰值學習率為1e-5,余弦衰減為0。對于連續預訓練,最多訓練30k步。在SFT期間,所有模型都針對一個epoch進行優化。

      模型使用MM1的預訓練檢查點進行初始化。這個階段對45M高分辨率OCR數據(包括PDFA、IDL、Renderedtext和DocStruct-4M)進行持續的預訓練,每個訓練批次從這四個數據集中均勻采樣數據。

      與SFT階段類似,作者使用靜態圖像分割,將每個圖像分為五個子圖像,每個子圖像的大小調整為672×672分辨率。作者發現這種高分辨率設置對于持續預訓練至關重要。

      最后,將數據集分組有助于數據平衡和簡化分析。在較高層面上,作者根據每個示例中呈現的圖像數量將數據集分為單圖像、多圖像和純文本類別,詳細的分類情況如下圖所示:

      研究人員根據主要衡量的功能將基準分為幾類,并提出類別平均分數(每個子類別的所有基準數字的平均分數),以代表該功能的平均性能。

      SFT消融

      然后是對于SFT數據混合的全面消融。作者首先評估一般數據類別,然后逐步評估單獨添加其他子類別的影響。

      在訓練過程中,作者混合來自不同子類別的數據,通過從混合物中隨機采樣數據來構建每個訓練批次,并使用類別平均得分來比較使用每種功能的模型,結果如下圖所示。

      作者觀察到,添加富含文本的數據可以顯著提高文本密集型和知識基準的性能,數學數據也遵循類似的趨勢。

      以一般數據類別為參考,對目標類別數據進行上采樣/下采樣,使得在每個訓練批次中,一般數據類別和目標類別的數據比例為1:α。

      為了衡量α的平均影響,作者提出MMBase分數用于模型比較。如下圖所示,作者針對不同的數據類別改變α。對于科學、數學和代碼類別,作者發現α的最佳比率分別為0.1、0.5和0.2。

      下一項需要探究的是單圖像、多圖像和純文本數據的混合比例。

      枚舉三個比率之間的所有組合將產生大量的計算成本。因此,作者分別對純文本數據和多圖像數據進行消融,以評估模型對比例的敏感程度。

      對于純文本數據,作者測試了0到0.2的范圍,下圖結果表明,不同的w值對模型的基礎影響較小。

      通過圖7(右)還可以觀察到,增加多圖像數據的采樣率會導致基本功能的性能下降(MMBase分數減少),而多圖像平均分數會增加。所以作者選擇w= 0.1為單圖像數據分配更高的權重,以提高潛在的性能。

      基于上述研究,作者提出了三種混合:基礎混合、單圖像混合、全混合。

      下圖前三列表明,包含參考數據和多圖像數據會稍微降低密集文本、知識和一般基準的平均性能。

      最后一欄表明,作者優化的組合實現了最佳的整體性能,平衡了基準測試中的所有功能。

      最后,放幾張跑分對比,包括Text-rich、In Context Learning和Multi-image:

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    毛片一区二区三区| 欧美在线制服丝袜| 亚洲香蕉伊在人在线观| 国产精品久久久一本精品 | 欧美性三三影院| 91一区二区在线观看| 99国产精品久久| 91亚洲精品乱码久久久久久蜜桃| av激情成人网| 91精品91久久久中77777| 91国产视频在线观看| 欧美日韩国产天堂| 精品久久五月天| 国产精品理论片在线观看| 亚洲日本青草视频在线怡红院 | 91老司机福利 在线| 91国偷自产一区二区使用方法| 91成人免费在线视频| 欧美日韩国产首页| 精品不卡在线视频| 中文字幕亚洲在| 亚洲v日本v欧美v久久精品| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美一区二区女人| 久久婷婷国产综合国色天香| 国产精品美女久久久久av爽李琼| 亚洲欧美日韩中文字幕一区二区三区| 亚洲午夜一区二区| 国产综合色精品一区二区三区| av一二三不卡影片| 3atv一区二区三区| 欧美激情一区二区三区四区| 亚洲图片一区二区| 国产精品12区| 91麻豆精品91久久久久久清纯 | 亚洲国产精品人人做人人爽| 久草在线在线精品观看| 99国内精品久久| 精品少妇一区二区三区在线视频 | 精品亚洲成a人在线观看| 成人一区二区三区视频在线观看 | 亚洲制服欧美中文字幕中文字幕| 久久成人免费日本黄色| 日本乱人伦一区| 国产片一区二区三区| 首页综合国产亚洲丝袜| 99久久国产综合精品色伊| 精品日产卡一卡二卡麻豆| 青青草原综合久久大伊人精品| 国产精品一二三四五| 香蕉影视欧美成人| 六月婷婷色综合| 日本精品裸体写真集在线观看| 精品黑人一区二区三区久久| 一区二区三区中文字幕电影| 国产精品系列在线播放| 在线电影院国产精品| 最新国产の精品合集bt伙计| 精品一区二区三区在线观看| 欧洲av一区二区嗯嗯嗯啊| 中文幕一区二区三区久久蜜桃| 日本女优在线视频一区二区| 色狠狠色噜噜噜综合网| 国产精品入口麻豆原神| 国产一区在线看| 欧美大片一区二区三区| 性感美女久久精品| 国产精品久久久久永久免费观看| 欧美探花视频资源| 欧美电影免费观看高清完整版| 日韩va欧美va亚洲va久久| 自拍偷拍欧美激情| 久久精品理论片| 蜜桃视频在线一区| 色婷婷精品久久二区二区蜜臂av | 欧美怡红院视频| 日韩欧美一级二级| 国产精品三级电影| 国产一区二区h| 精品日韩欧美在线| 视频精品一区二区| 欧美福利一区二区| 丝袜美腿亚洲色图| 777久久久精品| 日本特黄久久久高潮| 欧美肥胖老妇做爰| 青青草91视频| 26uuu精品一区二区三区四区在线| 精品亚洲成a人在线观看| 精品av综合导航| 国产不卡免费视频| 成人欧美一区二区三区小说| 色综合久久久久网| 亚洲国产裸拍裸体视频在线观看乱了| 欧美日韩一区在线观看| 日本不卡免费在线视频| 精品少妇一区二区三区视频免付费 | 国产精品蜜臀av| 91天堂素人约啪| 亚洲国产精品自拍| 日韩欧美中文字幕制服| 国产一区二区福利视频| 欧美高清在线一区二区| 色综合激情五月| 午夜av电影一区| 精品电影一区二区| 不卡电影免费在线播放一区| 一区二区三区四区在线播放 | 色偷偷成人一区二区三区91| 一区二区三区在线影院| 欧美理论在线播放| 国产尤物一区二区在线| 国产精品毛片大码女人| 欧美视频日韩视频| 乱中年女人伦av一区二区| 亚洲国产成人自拍| 欧美日韩国产综合久久 | 亚洲欧美精品午睡沙发| 欧美日本韩国一区二区三区视频| 激情亚洲综合在线| 亚洲精品成人在线| 精品成人一区二区三区四区| 91在线观看地址| 精品一区二区av| 尤物视频一区二区| 久久久久久久久久久久久夜| 色综合咪咪久久| 麻豆精品精品国产自在97香蕉 | 欧美日韩大陆在线| 国产69精品久久777的优势| 亚洲一区二区成人在线观看| 久久久不卡网国产精品一区| 欧美三级中文字幕在线观看| 国产成人av影院| 免费精品视频在线| 亚洲精品写真福利| 国产三级欧美三级| 欧美一二三区在线| 91精品1区2区| 成人av电影在线| 国产在线国偷精品产拍免费yy | 欧美年轻男男videosbes| 高清在线观看日韩| 久久国产麻豆精品| 亚洲一区二区在线观看视频| 国产精品久久毛片av大全日韩| 日韩写真欧美这视频| 欧美视频在线观看一区| 91首页免费视频| 成人午夜免费视频| 国产一区二区在线影院| 蜜桃久久av一区| 日韩经典一区二区| 日韩精品久久理论片| 亚洲午夜激情网页| 亚洲精品高清在线| 亚洲美女在线国产| 亚洲天堂免费看| 亚洲视频在线一区观看| 国产精品电影一区二区三区| 欧美激情艳妇裸体舞| 国产日韩欧美一区二区三区乱码 | 91高清视频在线| 色老汉av一区二区三区| 日本电影亚洲天堂一区| 一本一道综合狠狠老| 色爱区综合激月婷婷| 91成人在线精品| 在线观看国产日韩| 精品视频在线看| 欧美日韩国产综合久久| 欧美剧情片在线观看| 日韩一区二区三区四区| 日韩免费电影一区| 久久久久久久久久看片| 欧美国产精品中文字幕| 国产精品久久福利| 一级日本不卡的影视| 日韩国产欧美三级| 国内不卡的二区三区中文字幕| 国产成人综合亚洲91猫咪| 99re这里只有精品6| 欧美色视频一区| 日韩午夜精品视频| 久久免费看少妇高潮| 国产精品女同互慰在线看| 亚洲欧美另类小说视频| 婷婷久久综合九色国产成人| 激情综合五月婷婷| 成人动漫av在线| 欧美三级欧美一级| 欧美成人r级一区二区三区| 国产精品免费看片| 亚洲成人精品影院| 国产一区二区三区视频在线播放| 成人av资源在线| 91精品国产综合久久久久久久久久| 精品久久久久久无| 亚洲免费av在线| 久久精品国产99久久6|