開源音頻模型Stable Audio Open，文本生成47秒高清音效

2024年06月06日 09:36:21 來源：AIGC開放社區公眾號

　　著名開源大模型平臺Stability.ai在官網宣布，開源最新文生音頻模型Stable Audio Open。

　　用戶通過文本就能生成最多47秒，鋼琴、笛子、鼓點、模擬人聲等不同類型的44.1kHz音效。

　　值得一提的是，Stable Audio Open支持數據微調，歌手、音樂人可以讓其生成基于自己的音樂數據，例如，架子鼓手可以根據自己的鼓點來進行微調。

　　根據Stability.ai介紹，Stable Audio Open使用了486，492個錄音訓練數據，其中472，618個來自Freesound，13874個來自免費音樂檔案館，并且所有音頻文件均根據 CC0、CC BY或CC Sampling+獲得了商業許可。

　　就是說通過Stable Audio Open生成的音效無需擔心商業化問題，不會受到法律方面的追究。

　　「AIGC開放社區」根據其提供的在線demo體驗了一下，在文本語義理解、生成音效等方面還是相當優秀。

　　需要注意的是，目前只支持英文提示詞，其他任何語言都不行，即便你使用了識別效果也是相當的差。

　　在生成的過程中，用戶可以對時間、擴散步數和CFG進行詳細控制，以達到更好的效果。例如，一首非常舒適抒情的鋼琴曲。

　　此外，Stable Audio Open目前只能用于學術研究，還無法商業化。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

華為Mate 70 Air正式上架：6.6mm機身塞進6500mAh電池、立

鴻蒙智行新款享界S9官宣11月7日開訂

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

開源音頻模型Stable Audio Open，文本生成47秒高清音效

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

開源音頻模型Stable Audio Open，文本生成47秒高清音效

擴展閱讀

最新新聞

熱門新聞