隨著國產公司推出的AI視頻技術的崛起,短劇市場迎來了新的變革。七火山公司在國內率先復現了Sora的成果,并通過Etna模型等創(chuàng)新技術取得了重大突破。
Etna模型采用了Diffusion Transformer處理視頻數據,實現了15秒4K60幀的超高清晰度,同時具備了時空理解能力和深度語義理解能力。
從上圖可以看出,相較于市場上的現有模型,Etna在時長、高清晰度、豐富生動細節(jié)和強語義理解上,都保持著較大優(yōu)勢。
為什么七火山能成為國內率先復現出Sora的公司?Sora的關鍵創(chuàng)新,是一個可以靈活地處理不同維度數據的Diffusion Transformer。時空壓縮器會把原始視頻轉映射到潛空間中,視覺Transformer(ViT)模型會對已經被分詞的潛表征進行處理,并輸出去除噪聲后的潛表征。
一個與CLIP模型類似的系統(tǒng)根據用戶的指令(已經通過大語言模型進行了增強)和潛視覺提示,引導擴散模型生成具有特定風格或主題的視頻。經過多次去噪處理之后,會得到生成視頻的潛表征,然后通過相應的解碼器映射回像素空間。
在相關領域技術積累的基礎上,Etna模型迅速抓住了Sora的精髓,另外還引入了幾項創(chuàng)新。技術架構創(chuàng)新主要是針對視頻的時空特性提出的挑戰(zhàn),如何從空間和時間上將視頻壓縮到潛空間,以實現高效去噪,如何將壓縮潛空間轉換為patches,并將其輸入到Transformer中,以及如何處理長距離的時空依賴性,并確保內容的一致性。
為此,Etna模型在主干網絡上采用了Diffusion架構,同時在一個更大的數據集上實驗和適配與Sora相似的Diffusion+Transform架構。融合了Diffusion模型和Transformer模型的優(yōu)勢,Etna形成了一種高效且先進的新型模型架構,提升了模型的生成效率,保證了生成內容的高質量和高一致性。
七火山公司不僅布局了AI多模態(tài)產品,還與小米、快手等合作伙伴展開戰(zhàn)略合作,共同探索短劇出海市場。
資本市場對七火山公司的發(fā)展充滿了期待,認為其具備了潛在的成長空間和投資價值。AI視頻技術的興起將顛覆整個短視頻產業(yè)鏈,為用戶帶來全新的觀影體驗,也為產業(yè)鏈上下游企業(yè)帶來了更多的商機和發(fā)展空間。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。
IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。