百度日前官方宣布文心一言語音定制功能上線,只需2秒鐘,AI 就能完美重建任何一個人的聲音,每個人都能擁有自己的AI聲優(yōu)。
用戶只需打開文心一言App,選擇創(chuàng)建智能體,點(diǎn)擊創(chuàng)建自己的聲音,隨后系統(tǒng)會給出一句話,只需用平時說話的語氣念一遍。
約2秒左右即可獲得媲美真人、流暢自然的合成效果,并且合成的音頻完美保持了朗讀這句話時的情感、風(fēng)格和自然度。
不僅如此,用戶還能構(gòu)建自己的個性化音庫,再匹配上虛擬形象,即可快速打造出一個數(shù)字分身。
此外,該功能對不同性別、不同年齡的人均適用,尤其是小孩和重口音的兼容效果非常出色,能很好的保留相應(yīng)的風(fēng)格和口音,適合中國社會地域分布廣泛,口音眾多的特點(diǎn)。
而且相比于傳統(tǒng)學(xué)術(shù)領(lǐng)域的語音合成技術(shù),百度新技術(shù)有較強(qiáng)的抗噪能力,即使原始錄制音頻背景嘈雜,依然能夠獲得流暢的、音質(zhì)干凈的合成效果。
據(jù)介紹,之所以能在2秒鐘內(nèi)復(fù)刻聲音,是因為百度的語音合成新技術(shù),可以讓AI真正理解文本和聲音的對應(yīng)關(guān)系。
很多時候甚至能理解文本中的情緒,最大程度上保持原聲的情感、風(fēng)格和自然度,因此只需要極短的樣本,幾秒鐘就能完成。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實(shí)、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。