阿里巴巴與中國科學技術大學聯(lián)手推出了一款名為ViViD的新框架,旨在革新虛擬試衣體驗。ViViD基于先進的擴散模型技術,能夠實現(xiàn)視頻中人物衣物的實時替換,從而生成自然且逼真的視頻效果。
ViViD的推出解決了以往視頻試衣中難以保持時間一致性和圖像質量的難題。它由三大核心組件構成:服裝編碼器、姿勢編碼器以及時間模塊。這些組件協(xié)同工作,不僅可以精確提取衣物細節(jié)的語義特征,還能對人物姿勢進行編碼,并確保整個視頻在時間線上的連貫性。
為了進一步提升試衣效果,研究團隊還引入了一種創(chuàng)新的注意力特征融合機制。這種機制優(yōu)化了衣物語義信息的整合過程,使得最終呈現(xiàn)的試衣效果更加貼合用戶的多樣化需求。無論是上半身、下半身還是連衣裙等不同類型的服裝,ViViD都能夠輕松應對,展現(xiàn)出其強大的適應性。
視頻來自官方項目頁
在實驗測試中,ViViD展現(xiàn)出了令人矚目的性能。與其他現(xiàn)有方法相比,它在視覺質量、時間一致性以及細節(jié)保持方面都取得了顯著優(yōu)勢。實際演示中,用戶可以選擇單獨更換上衣或褲子,或者同時替換兩者,這種靈活的選擇極大地豐富了用戶體驗。
為了全面評估ViViD的性能,阿里和中科大的研究團隊投入了大量資源構建了一個專門的數(shù)據(jù)集,命名為ViViD數(shù)據(jù)集。這個數(shù)據(jù)集包含了高達9700個服裝視頻對,分辨率高達832×624,是目前公開數(shù)據(jù)中規(guī)模最大、多樣性最高且分辨率最清晰的視頻虛擬試衣數(shù)據(jù)集。
ViViD的問世不僅是人工智能領域的一項技術突破,更是虛擬試衣技術邁向實用化的重要一步。隨著這一新框架的推廣和應用,未來消費者在線上購物時將能享受到更加便捷、直觀的試衣新體驗,為零售商和電商企業(yè)帶來新的增長機遇。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。
IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。