国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    在視覺提示中加入「標記」,微軟等讓GPT-4V看的更準、分的更細

    2023年10月24日 17:04:15 來源:微信公眾號 機器之心

      本文來自于微信公眾號 機器之心(ID:almosthuman2014),作者:機器之心。

      最近一段時間,我們見證了大型語言模型(LLM)的顯著進步。特別是,生成式預訓練 Transformer 或 GPT 的發布引領了業界和學術界的多項突破。自 GPT-4發布以來,大型多模態模型 (LMM) 引起了研究界越來越多的興趣,許多工作致力于構建多模態 GPT-4。

      近日,GPT-4V(ision) 由于出色的多模態感知和推理能力得到了大家格外的關注。然而,盡管 GPT-4V 具有前所未有的視覺語言理解能力,但其細粒度 visual grounding(輸入是圖片和對應的物體描述,輸出是描述物體的 box)能力相對較弱,或者尚未發揮出來。

      舉例來說,當用戶詢問下圖中「放置在右邊筆記本電腦的左邊是什么物體?」GPT-4V 給出了馬克杯這個錯誤的答案。當用戶接著詢問,「想找一個靠窗的座位,我可以坐在哪里?」GPT-4V 同樣回答不正確。

      在意識到上述問題后,來自微軟、香港科技大學等機構的研究者提出了一種新的視覺 prompt 方法 Set-of-Mark(SoM),來解決 GPT-4V 在細粒度視覺任務上的問題。

      如圖1(右)所示,SoM 采用交互式分割模型(例如 SAM)將圖像劃分為不同粒度級別的區域,并在這些區域上添加一組標記(mark),例如字母數字、掩碼(mask)、框(box)。使用添加標記的圖像作為輸入,以解決上述問題。

      我們先來看下效果,左為 GPT-4V,右為 GPT-4V+SoM,很明顯后者分類更細致、準確。

      下圖示例依然如此,GPT-4V+SoM 效果更明顯。

      此外,對于這項研究,有人問道:「SoM 是手動(人工輸入)還是自動的?」

      論文一作 Jianwei Yang 表示,SoM 是自動或半自動的。他們編譯了很多自己構建自己的分割工具,比如 SEEM、Semantic-SAM 和 SAM,用來幫助用戶自動為圖像分割區域。同時用戶也可以自己選擇區域。

      使用 SoM prompt GPT-4V 的獨特優點是它可以產生文本之外的輸出。由于每個標記都與掩碼表征的圖像區域特定關聯,因此可以追溯文本輸出中任何提到的標記的掩碼。

      生成成對文本和掩碼的能力使 SoM 能夠 prompt GPT-4V 來生成視覺關聯的文本,更重要的是支持各種細粒度視覺任務,這對普通的 GPT-4V 模型來說是一個挑戰。

      通過簡單的 prompt 工程,SoM 可以讓 GPT-4V 廣泛地用于多種視覺任務,例如:

      開放詞匯圖像分割:該研究要求 GPT-4V 詳盡地給出所有標記區域的類別以及從預定池中選擇的類別。

      參考分割:給定一個參考表達式,GPT-4V 的任務是從圖像分區工具箱生成的候選區域中選擇最匹配的區域。

      短語關聯(Phrase Grounding):與參考分割略有不同,短語關聯使用由多個名詞短語組成的完整句子。該研究要求 GPT-4V 為所有標記的短語分配相應的區域。

      視頻對象分割:以兩個圖像作為輸入。第一個圖像是查詢圖像,其中包含第二個圖像中需要識別的一些對象。鑒于 GPT-4V 支持多個圖像作為輸入,因此 SoM 也可以應用于視頻中跨幀的關聯視覺對象。

      實驗及結果

      研究者使用「分而治之」(divide-and-conquer)的策略來運行實驗和評估。對于每個實例,他們使用新的聊天窗口,這樣一來,評估期間就不會出現上下文泄露了。

      具體來講,研究者從每個數據集中選擇了小規模的驗證數據子集。對于數據集中的每個圖像,他們在使用圖像分割工具箱提取的區域上覆蓋了一組標記。同時基于具體的任務,研究者利用不同的分割工具來提出區域。

      下表1列出了每個任務的設置細節。

      研究者將其方法與以下模型進行比較:

      預測坐標的 GPT-4V 基線模型

      SOTA 專用模型

      開源 LMM

      定量結果

      詳細的實驗結果如下表2所示。

      首先是圖像分割任務。研究者將 GPT-4V + SoM 與 COCO Panoptic 分割數據集上的強大分割模型 MaskDINO、ADE20K Panoptic 分割數據集上的模型 OpenSeeD 進行了比較。

      結果顯示,GPT-4V + SoM 的零樣本性能接近微調后的 MaskDINO,并大幅優于 OpenSeeD。GPT-4V 在 COCO 和 ADE20K 上的相似性能表現出其對廣泛視覺和語義域任務的強大泛化能力。

      然后是參考(referrring)任務,研究者評估了 RefCOCOg 數據集上的模型 RES 和 REC。他們使用 MaskDINO 來提出掩碼,并在圖像上覆蓋上掩碼和數字。同時使用 mIoU 作為評估指標,并與 SOTA 專用模型 PolyFormer 和 SEEM 進行比較。

      結果顯示,GPT-4V+SoM 擊敗了 Grounding DINO、Polyformer 等專用模型以及 Shikra、LLaVA-1.5、MiniGPT-v2和 Ferret 等最近的開源 LMM。

      接著是 Flickr30K 上的短語關聯任務,研究者使用 Grounding DINO 為每個圖像生成框建議。GPT-4V+SoM 實現了比 GLIPv2和 Grounding DINO 更強的零樣本性能。

      最后研究者在 DAVIS2017數據集上評估了視頻分割任務。GPT-4V+SoM 實現了優于其他專用視覺模型的最佳追蹤性能(78.8J&F)。

      消融研究

      研究者探討了標記類型如何影響 Flickr30k 數據集上短語關聯任務的最終性能,并比較了兩種類型的標記。第一種是數字和掩碼,第二種是數字、掩碼和框。

      結果如下表3所示,添加額外的框可以顯著提升性能。

      此外研究者探究了當生成帶有真值注釋的標記時,GPT-4V 如何表現。他們選擇在 RefCOCOg 驗證集中用真值掩碼替換預測到的分割掩碼。這意味著 GPT-4V 只需要從注釋短語區域選擇一個即可。如預期一樣,參考分割的性能可以得到進一步提升,尤其是當分割模型有一些缺失的區域。

      結果如下表4所示,在 SoM 中使用真值掩碼可以將 RefCOCOg 上的性能提升14.5%(mIoU)。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    白白色 亚洲乱淫| 捆绑变态av一区二区三区| 欧美日本韩国一区二区三区视频| 91免费观看视频在线| 国产福利视频一区二区三区| 精品一二三四在线| 国产精品一区一区| 风间由美一区二区av101| 国产91在线看| 成人黄色电影在线| av在线一区二区| 91亚洲国产成人精品一区二区三| 成人毛片视频在线观看| 白白色 亚洲乱淫| 一本色道久久加勒比精品| 欧美影视一区在线| 欧美群妇大交群的观看方式| 91精品国产综合久久蜜臀| 日韩欧美色电影| 久久久99精品免费观看不卡| ...xxx性欧美| 亚洲国产三级在线| 蜜桃视频一区二区三区| 国产精品亚洲第一区在线暖暖韩国 | 色先锋aa成人| 678五月天丁香亚洲综合网| 欧美成人一区二区三区| 欧美国产禁国产网站cc| 亚洲乱码中文字幕综合| 三级一区在线视频先锋| 国产精品小仙女| 欧美日韩在线三级| 久久久久久久久一| 亚洲观看高清完整版在线观看 | 99视频热这里只有精品免费| 欧美日韩大陆在线| 国产欧美日韩激情| 亚洲国产一区二区视频| 国产精品综合在线视频| 色综合 综合色| 久久久久久久久久久久电影 | 欧美精品久久天天躁| 久久人人爽爽爽人久久久| 亚洲人精品午夜| 国产一区二区三区高清播放| 91欧美一区二区| ww亚洲ww在线观看国产| 亚洲国产精品久久久久秋霞影院 | 日韩免费在线观看| 一二三四社区欧美黄| 国产很黄免费观看久久| 欧美乱妇一区二区三区不卡视频| 国产精品进线69影院| 国产一区二区免费看| 91精品欧美综合在线观看最新| 国产精品久久久久影视| 国产一区二区三区| 欧美一级片在线看| 亚洲午夜精品一区二区三区他趣| 成人亚洲精品久久久久软件| 欧美xxxxx牲另类人与| 日韩一区精品视频| 欧美日韩午夜在线视频| 亚洲精品精品亚洲| 99精品国产99久久久久久白柏| 精品国产乱码久久久久久久久| 香蕉成人啪国产精品视频综合网| 色综合一个色综合亚洲| 中文字幕一区二区三区不卡| 成人激情开心网| 国产亚洲综合av| 久久国产欧美日韩精品| 欧美日韩精品福利| 亚洲线精品一区二区三区八戒| 91女神在线视频| 综合网在线视频| 91在线精品一区二区三区| 最新热久久免费视频| 99久久久免费精品国产一区二区| 国产精品视频yy9299一区| 成人在线视频首页| 国产精品美女一区二区| 成人午夜免费视频| 国产精品久久免费看| 91丨porny丨首页| 一区二区三区免费观看| 欧美视频一区在线| 午夜精品一区二区三区电影天堂 | 日本在线不卡视频一二三区| 欧美最新大片在线看| 亚洲综合色成人| 在线精品观看国产| 石原莉奈在线亚洲二区| 欧美精品亚洲一区二区在线播放| 一区二区三区欧美日| 欧美日韩一区二区三区在线 | 国产精品久久久久久久久久久免费看| 国产成人午夜片在线观看高清观看| 精品国产人成亚洲区| 国产99精品国产| 亚洲啪啪综合av一区二区三区| 色综合激情久久| 日本美女一区二区三区视频| 精品播放一区二区| 99视频超级精品| 日韩国产欧美在线播放| 精品国产乱码久久久久久夜甘婷婷 | 国产日产精品1区| 欧美在线观看18| 久久精品噜噜噜成人88aⅴ| 亚洲国产精品成人综合色在线婷婷| 99精品久久只有精品| 丝袜美腿成人在线| 欧美国产精品v| 欧美久久久久久蜜桃| 国产精品亚洲一区二区三区妖精| 亚洲人123区| 精品处破学生在线二十三| 91在线视频在线| 久久国产精品免费| 一区二区三区在线观看欧美| 欧美一区二区黄色| 91网站最新网址| 久久99国产精品久久| 夜夜亚洲天天久久| 国产日韩欧美在线一区| 欧美高清dvd| 91亚洲精品久久久蜜桃网站 | 欧美在线观看一区| 国产精品18久久久久久久久久久久 | 在线区一区二视频| 国产suv精品一区二区6| 天堂va蜜桃一区二区三区| 国产精品护士白丝一区av| 日韩精品中文字幕一区二区三区 | 国产中文字幕一区| 一本大道综合伊人精品热热| 色婷婷精品大视频在线蜜桃视频| 日本大胆欧美人术艺术动态| 欧美国产日韩亚洲一区| 欧美一区二区黄| 欧美亚洲国产怡红院影院| 国产91色综合久久免费分享| 蜜臀av一区二区在线观看| 亚洲综合图片区| 亚洲欧美另类图片小说| 国产精品剧情在线亚洲| 国产欧美精品国产国产专区 | 国产无人区一区二区三区| 欧美人xxxx| 欧洲国产伦久久久久久久| 色综合久久99| 色综合激情久久| 欧美最猛黑人xxxxx猛交| 一本大道久久a久久综合婷婷 | 2021久久国产精品不只是精品| 欧美日韩日日夜夜| 欧美亚洲国产一区二区三区| 色国产综合视频| 91福利视频久久久久| 色呦呦日韩精品| 91国偷自产一区二区三区成为亚洲经典| 国产成人免费在线观看| 国产福利不卡视频| 韩国av一区二区三区在线观看| 日韩精品乱码免费| 日韩不卡在线观看日韩不卡视频| 亚洲无人区一区| 天天亚洲美女在线视频| 日本强好片久久久久久aaa| 日日夜夜精品视频天天综合网| 午夜一区二区三区在线观看| 五月婷婷综合在线| 日韩av一区二区在线影视| 久久成人免费电影| 国产精品一区二区视频| 成人aa视频在线观看| 在线一区二区三区| 欧美视频在线一区二区三区| 欧美美女一区二区在线观看| 欧美日韩国产另类不卡| 欧美岛国在线观看| 国产日韩欧美不卡| 亚洲三级视频在线观看| 亚洲国产一区二区视频| 日韩国产成人精品| 国内精品视频666| 成人毛片视频在线观看| 在线免费观看日本一区| 欧美一级片在线| 2020国产精品自拍| 亚洲视频在线一区| 日本亚洲电影天堂| 国产v综合v亚洲欧| 欧美日韩国产高清一区二区| 久久综合久久久久88| 亚洲视频狠狠干| 蜜桃在线一区二区三区| 99久久国产综合精品麻豆| 宅男在线国产精品|