Stability AI Japan最近發布了兩款令人矚目的日語語言模型,分別命名為“Japanese Stable LM3B-4E1T”和“Japanese Stable LM Gamma7B”。
前者具有大約30億參數,而后者則擁有高達70億參數的龐大規模。這兩款模型以Apache2.0許可證發布,允許商業使用,為日本的自然語言處理領域帶來了一次革命性的突破。
這兩個模型的背景可追溯到之前發布的英語語言模型,具體為“Stable LM3B-4E1T”和“Mistral-7B-v0.1”。最初,它們在主要使用英語數據進行訓練,因此在英語處理方面表現出色,但在日語處理能力上受限,這是因為日語數據相對較少。
為了提高其日語語言能力,這兩個模型經歷了持續的預訓練,利用了來自維基百科、mC4、CC-100、OSCAR和SlimPajama(不包括Books3)等數據源的大約1000億token。
這兩款模型的性能評估采用了與之前發布的“Japanese Stable LM Alpha”相同的方法。評估包括了日本語言理解基準(JGLUE)任務,涵蓋了句子分類、句子對分類、問題回答和文本摘要等八項任務。結果顯示,盡管只有30億參數,但“Japanese Stable LM3B-4E1T”在多項任務上表現出色,而“Japanese Stable LM Gamma7B”甚至獲得更高的分數,展示了這些模型在日語自然語言處理方面的卓越進展。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。