著名開源大模型平臺Stability.ai在官網宣布,開源最新文生音頻模型Stable Audio Open。
用戶通過文本就能生成最多47秒,鋼琴、笛子、鼓點、模擬人聲等不同類型的44.1kHz音效。
值得一提的是,Stable Audio Open支持數據微調,歌手、音樂人可以讓其生成基于自己的音樂數據,例如,架子鼓手可以根據自己的鼓點來進行微調。
根據Stability.ai介紹,Stable Audio Open使用了486,492個錄音訓練數據,其中472,618個來自Freesound,13874個來自免費音樂檔案館,并且所有音頻文件均根據 CC0、CC BY或CC Sampling+獲得了商業許可。
就是說通過Stable Audio Open生成的音效無需擔心商業化問題,不會受到法律方面的追究。
「AIGC開放社區」根據其提供的在線demo體驗了一下,在文本語義理解、生成音效等方面還是相當優秀。
需要注意的是,目前只支持英文提示詞,其他任何語言都不行,即便你使用了識別效果也是相當的差。
在生成的過程中,用戶可以對時間、擴散步數和CFG進行詳細控制,以達到更好的效果。例如,一首非常舒適抒情的鋼琴曲。
此外,Stable Audio Open目前只能用于學術研究,還無法商業化。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。