近日,摩爾線程公司宣布正式開源其研發的音頻理解大模型——MooER(摩耳),這一業界首個基于國產全功能GPU進行訓練和推理的大型開源語音模型,展示了摩爾線程在人工智能領域的最新成果。
MooER大模型在摩爾線程夸娥(KUAE)智算平臺上,僅用38小時便完成了5000小時音頻數據和偽標簽的訓練。這一成就得益于公司自研的創新算法和高效計算資源的結合。MooER不僅支持中文和英文的語音識別,還具備中譯英的語音翻譯能力,在多個語音識別領域的測試集中展現出優異表現。特別在Covost2中譯英測試集中,MooER-5K取得了25.2的BLEU分數,接近工業級效果。
摩爾線程AI團隊開源了推理代碼和5000小時數據訓練的模型,并計劃進一步開源訓練代碼和基于8萬小時數據訓練的模型。MooER的模型結構包括Encoder、Adapter和Decoder三個部分,使用開源的Paraformer語音編碼器、Qwen2-7B-instruct大語言模型來初始化Encoder和LLM模塊。
在技術對比中,MooER-5K在中文和英文測試集上的表現均優于其他開源模型。摩爾線程通過這一開源項目,為數據資源和計算資源有限的開發者提供了寶貴的參考和支持。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。