網易有道宣布正式開源“子曰3”系列大模型的數(shù)學模型(英文名稱Confucius3-Math)。這是國內首個專注于數(shù)學教育,可在單塊消費級GPU上高效運行的開源推理模型。其在一系列數(shù)學推理任務中取得當前最優(yōu)性能,超越了許多規(guī)模更大的通用模型。該模型的開源,為教育領域提供了低成本、高性能的AI解決方案,推動大模型技術向教育領域加速滲透。
網易有道稱,測試數(shù)據(jù)顯示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等數(shù)據(jù)集上,14B輕量級的“子曰3數(shù)學模型”各項得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)這一基于高考數(shù)學題的大模型評測框架中,“子曰3數(shù)學模型”的得分高達98.5分。其訓練成本僅為2.6萬美元,推理性能約為DeepSeek R1的15倍。
據(jù)悉,“子曰3數(shù)學模型”在解決國內數(shù)學問題任務中展現(xiàn)出了顯著優(yōu)勢。其通過大規(guī)模增強學習以及一系列的創(chuàng)新算法,訓練成本僅為2.6萬美元,推理性能約為DeepSeek R1的15倍。
測試數(shù)據(jù)顯示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等數(shù)據(jù)集上,14B輕量級的“子曰3數(shù)學模型”各項得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)這一基于高考數(shù)學題的大模型評測框架中,“子曰3數(shù)學模型”的得分高達98.5分。
除了出色的性能,“子曰3數(shù)學模型”的成本優(yōu)勢同樣顯著,其在消費級GPU即可運行,大大降低了教育場景的AI應用門檻。
此次“子曰3數(shù)學模型”發(fā)布及開源,標志著“子曰”大模型系列在輕量級模型推理能力上實現(xiàn)了又一重要突破,也使得有道在教育大模型領域長期積累的技術成果能夠共享給更多的開發(fā)者和從業(yè)者,構建起協(xié)同發(fā)展的行業(yè)格局。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據(jù)此操作,風險自擔。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創(chuàng)作風格。
IDC今日發(fā)布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。