瀾舟科技近日宣布,其研發的孟子3-13B大模型正式開源,并向學術研究領域全面開放,同時支持免費商用。這一輕量化大模型在多項基準測試中展現了優異的性能,特別是在參數量20B以內的模型中,其中英文語言能力尤為突出,數學和編程能力也位于行業前列。
孟子3-13B大模型基于Llama架構,經過高達3T Tokens的數據集訓練,該數據集包括網頁、百科、社交、媒體、新聞以及高質量的開源數據集。模型在萬億tokens上進行了多語言語料的繼續訓練,使其中文能力得到顯著提升,同時也具備了強大的多語言處理能力。

為了便于用戶快速部署和使用,瀾舟科技提供了簡單的兩步操作。首先,用戶需要進行環境配置,通過pip命令安裝必要的依賴。隨后,用戶可以通過提供的代碼快速開始使用模型,進行基礎的交互推理。此外,瀾舟科技還提供了樣例代碼和模型微調的相關文件和代碼,以便用戶根據自己的需求進行定制和優化。
瀾舟科技的選擇背后有著明確的商業考量。公司專注于服務ToB場景,并在實踐中發現,ToB場景中使用頻率最高的大模型參數量集中在10B-100B之間。從投資回報率角度出發,這一參數規模范圍的模型既能滿足場景需求,又具有高性價比。因此,瀾舟科技致力于在這一參數規模范圍內打造優質的行業大模型。
孟子3-13B大模型的開源,是瀾舟科技在大模型領域的又一重要里程碑。去年3月,瀾舟科技發布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2對公眾開放。現在,感興趣的用戶可以通過GitHub、HuggingFace、ModelScope和Wisemodel等平臺體驗和使用孟子3-13B大模型。
隨著孟子3-13B大模型的開源,瀾舟科技進一步鞏固了其在AI大模型行業的領先地位,并為學術研究和商業應用提供了強大的支持。這一舉措無疑將推動大模型技術的發展和應用,為AI產業的進步貢獻力量。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。