谷歌DeepMind與布朗大學(xué)合作開發(fā)的“力提示”(force prompting)技術(shù),為視頻生成領(lǐng)域帶來突破。該技術(shù)無需3D模型或物理引擎,僅通過指定力的方向和強(qiáng)度,即可生成自然流暢的運(yùn)動(dòng)效果。支持全局力(如風(fēng))和局部力(如敲擊)兩種模式,力以矢量場(chǎng)形式輸入系統(tǒng)。
研究基于CogVideoX-5B-I2V模型,加入ControlNet模塊處理數(shù)據(jù),利用Transformer架構(gòu)生成49幀視頻,僅需4臺(tái)Nvidia A100 GPU訓(xùn)練一天。訓(xùn)練數(shù)據(jù)完全合成,包括旗幟飄動(dòng)、球體滾動(dòng)等場(chǎng)景。模型在文本提示中加入物理術(shù)語后,能自動(dòng)建立正確的力與運(yùn)動(dòng)關(guān)系,并展現(xiàn)出強(qiáng)大的泛化能力。
用戶測(cè)試顯示,“力提示”技術(shù)在運(yùn)動(dòng)匹配度和真實(shí)感上優(yōu)于基準(zhǔn)模型,盡管在復(fù)雜場(chǎng)景中仍存不足,但其進(jìn)步標(biāo)志著AI正逐步理解物理規(guī)則,邁向更通用的人工智能。DeepMind首席執(zhí)行官Demis Hassabis認(rèn)為,這是AI發(fā)展的重要一步。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。