中山大學(xué)HCP實(shí)驗(yàn)室聯(lián)合Sea AI Lab和哈佛大學(xué)等單位開展的一項(xiàng)研究,成功地讓大型人工智能模型通過講笑話的方式,探索多模態(tài)大模型的創(chuàng)造力,并因此獲得了計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域的頂級(jí)會(huì)議CVPR的認(rèn)可。
這項(xiàng)研究的關(guān)鍵在于使用來自日本的“大喜利”(Oogiri)創(chuàng)新響應(yīng)游戲作為數(shù)據(jù)源。傳統(tǒng)的大模型,如GPT-4,處理這類任務(wù)時(shí)往往表現(xiàn)得過于正經(jīng),缺乏幽默感。而中山大學(xué)的“梗王大模型”則能夠根據(jù)圖像或文本輸入,生成具有幽默感和創(chuàng)意的響應(yīng)。
“大喜利”游戲要求玩家對(duì)提供的多模態(tài)內(nèi)容(如問題、圖像等)給出幽默和創(chuàng)意的回應(yīng)。例如,一張老人向年輕人求助的圖片,傳統(tǒng)回應(yīng)可能是詢問路線,而“大喜利”風(fēng)格的回應(yīng)可能是請(qǐng)求幫助解開手銬,這種出人意料的回答具有強(qiáng)烈的幽默沖擊感。
研究團(tuán)隊(duì)采用了一種新的非順序、創(chuàng)造性思維范式——跳躍思維(Leap-of-Thought,LoT),以及一套基于此范式的訓(xùn)練方法CLoT。CLoT包括關(guān)聯(lián)性指令微調(diào)和探索性自我調(diào)整兩個(gè)階段,旨在激發(fā)模型的創(chuàng)新響應(yīng)能力。
性能評(píng)估方面,CLoT在Oogiri-GO數(shù)據(jù)集上的選擇題和排序題評(píng)估中,顯著提高了多模態(tài)大模型的性能,并超越了包括GPT-4在內(nèi)的其他先進(jìn)模型。用戶調(diào)查也證實(shí)了CLoT在生成幽默內(nèi)容方面的優(yōu)越性。此外,CLoT在其他任務(wù)如“看云猜物CGG”和“發(fā)散思維測(cè)試DAT”中也展現(xiàn)了良好的泛化能力。
中山大學(xué)人機(jī)物智能融合實(shí)驗(yàn)室(HCP Lab)由林倞教授于2010年創(chuàng)立,專注于多模態(tài)內(nèi)容理解、因果及認(rèn)知推理、具身學(xué)習(xí)等領(lǐng)域的研究,并取得了豐富的學(xué)術(shù)成果。此次研究的成功,不僅展示了該實(shí)驗(yàn)室在AI領(lǐng)域的創(chuàng)新能力,也為未來的人工智能研究提供了新的思路和方法。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。