近日,阿里巴巴在人工智能領(lǐng)域再次取得突破,推出了一款名為AtomoVideo的高保真圖像到視頻生成框架。這一技術(shù)的問世,標(biāo)志著基于文本到圖像生成技術(shù)的視頻生成領(lǐng)域取得了顯著的快速發(fā)展。
據(jù)官方介紹,AtomoVideo的核心在于其多粒度圖像注入技術(shù),這一技術(shù)使得生成的視頻對于給定的圖像具有更高的保真度。這意味著,通過AtomoVideo生成的視頻,能夠更好地保留原始圖像的細(xì)節(jié)和特征,從而使得生成的視頻更加逼真。目前,阿里只發(fā)布了AtomoVideo的論文,代碼,試玩頁面等還未公布。

此外,AtomoVideo還得益于高質(zhì)量的數(shù)據(jù)集和訓(xùn)練策略,這使得其在保持卓越的時(shí)間性的同時(shí),實(shí)現(xiàn)了更大的運(yùn)動強(qiáng)度,一致性和穩(wěn)定性。這意味著,無論是在動作的連貫性,還是在動作的穩(wěn)定性上,AtomoVideo都能表現(xiàn)出色。
AtomoVideo的架構(gòu)也具有很高的靈活性,它可以靈活地?cái)U(kuò)展到視頻幀預(yù)測任務(wù),通過迭代生成實(shí)現(xiàn)長序列預(yù)測。這使得AtomoVideo在處理長序列的視頻預(yù)測任務(wù)時(shí),也能夠保持良好的性能。
值得一提的是,由于適配器訓(xùn)練的設(shè)計(jì),AtomoVideo可以很好地與現(xiàn)有的個(gè)性化模型和可控模塊結(jié)合。這使得AtomoVideo在實(shí)際應(yīng)用中,可以根據(jù)需要進(jìn)行個(gè)性化定制,以滿足不同用戶的需求。
不過從AK大神發(fā)布的演示來看,AtomoVideo生成的視頻質(zhì)量和sora相比差距較大,和SVD相比也有一些差距,希望后續(xù)會有更大的提升吧。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報(bào)告。中國AI云市場阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。