Rhymes AI近日發布了其革命性文本-圖像到視頻生成模型Allegro-TI2V,這一突破性技術為數字內容創作開辟了全新的疆界。作為生成式AI的最新進展,Allegro-TI2V為創意工作者提供了前所未有的視覺敘事工具,標志著AI技術在創意領域的巨大潛力。
Allegro-TI2V在多個技術規格上表現卓越,支持高達79.2K的上下文長度,相當于88幀視頻。其輸出分辨率為720×1280像素,視頻生成速度為每秒15幀,用戶還可以選擇插值至30FPS,以滿足不同應用場景的需求。這款模型的架構非常復雜,包含了1.75億參數的VideoVAE和28億參數的VideoDiT模型,使其能夠精準捕捉用戶輸入的文本提示和初始圖像的本質。此外,Allegro-TI2V還支持多精度模式(FP32、BF16、FP16),在BF16模式下,生成視頻僅需9.3GB的GPU內存,極大降低了硬件需求。
Allegro-TI2V的創新之處在于其引入了兩種全新的生成模式:后續視頻生成:基于文本提示和初始幀,創建連續的視頻內容。這種模式能夠幫助創作者輕松生成符合設定主題和風格的視頻。中間視頻生成:在給定視頻的首尾幀的基礎上,生成自然過渡的中間幀,打破傳統視頻編輯的時間與空間限制。
這些創新模式使得Allegro-TI2V能夠為創作者提供更高效、更靈活的視頻創作方式,大大提升了創作效率和質量。
Rhymes AI在Apache2.0許可下發布了Allegro-TI2V,使得研究人員、開發者和內容創作者能夠更容易地訪問和使用這一技術。用戶只需安裝Python3.10+、PyTorch2.4+和CUDA12.4+,便可輕松上手并快速體驗這一先進技術。
Allegro-TI2V的應用前景極為廣泛,從電影制作、游戲開發到數字藝術和創意原型,都能充分發揮其強大的生成能力。根據開發者提供的數據,單個***GPU在約20分鐘內即可生成6秒的視頻,而使用8個***GPU配置,生成時間將縮短至3分鐘,顯著提升了視頻內容創作的效率。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。