首頁 > 云計算頻道 > 大模型

Open-Sora悄悄升級支持16秒視頻生成和720p分辨率

2024年04月25日 14:36:28 來源：站長之家

　　Open-Sora 在開源社區悄悄更新了，現在，該項目不僅支持長達16秒的單鏡頭視頻生成，而且視頻分辨率最高可達720p，能夠處理各種寬高比的文本到圖像、文本到視頻、圖像到視頻、視頻到視頻以及無限長視頻的生成需求。

　　技術報告與模型架構:

　　Open-Sora技術報告已在GitHub上發布，詳細介紹了新功能和模型架構。

　　作者團隊對STDiT架構進行了關鍵性改進，提高了模型的訓練穩定性和整體性能。

　　引入了旋轉位置編碼(RoPE embedding)和QK歸一化技術，以增強訓練穩定性。

　　ST-DiT-2架構能夠自動縮放位置編碼，處理不同大小尺寸的輸入。

　　多階段訓練方法:

　　Open-Sora采用了多階段訓練方法，通過分步驟引入數據，高效實現高質量視頻生成。

　　初始階段視頻采用144p分辨率，混訓圖片和更高分辨率視頻。

　　第二階段提升至240p和480p分辨率，第三階段進一步增強至480p和720p。

　　統一的圖生視頻/視頻生視頻框架:

　　基于Transformer，DiT架構可支持圖像到圖像及視頻到視頻任務。

　　提出掩碼策略來支持圖像和視頻的條件化處理。

　　掩碼策略配置:

　　引入了隨機掩碼策略，以隨機方式選擇并取消掩碼的幀，提高模型處理圖像條件化的能力。

　　支持多時間/分辨率/長寬比/幀率訓練:

　　通過分桶策略，使用原始視頻的分辨率、長寬比和長度進行訓練，增加采樣靈活性。

　　數據收集和預處理流程:

　　作者團隊提供了詳盡的數據收集與處理指南，分享了自動化的數據處理流程。

　　性能全方位評測:

　　Open-Sora能夠將文字描述轉化為動人的動態視頻，支持多種內容、分辨率、長寬比和時長的生成。

　　盡管取得了進展，但當前生成的視頻在噪聲問題、時間一致性、人物生成質量以及美學評分方面仍有待改進。作者團隊將在下一版本中優先解決這些挑戰。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

一加Ace 6T官宣：全球首發驍龍8 Gen5

真我GT8 Pro阿斯頓馬丁F1限量版開售，16GB+1TB售價5499元

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

Open-Sora悄悄升級支持16秒視頻生成和720p分辨率

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

Open-Sora悄悄升級 支持16秒視頻生成和720p分辨率

擴展閱讀

最新新聞

熱門新聞

Open-Sora悄悄升級支持16秒視頻生成和720p分辨率