國產(chǎn)大模型深水區(qū),登頂之后的算力、生態(tài)與規(guī)模新挑戰(zhàn)。
今年年初,DeepSeek橫空出世,讓世界重新認識了中國大模型。
幾乎在DeepSeek爆紅的同一時間,科大訊飛發(fā)布了全國產(chǎn)算力平臺上首個深度推理大模型——訊飛星火X1,其獨一無二的標簽是“唯一基于全國產(chǎn)算力訓(xùn)練的深度推理模型”。
1萬張華為昇騰910B國產(chǎn)算力卡,訓(xùn)練出的星火X1在模型參數(shù)比業(yè)界同類小一個數(shù)量級的情況下,整體效果卻能對標OpenAI o1和DeepSeek R1。
在曠日持久的科技賽跑中,科大訊飛用實際行動走出了一條自主可控,雖然艱辛,但更值得夸贊大模型發(fā)展路線。
01 技術(shù)突圍,國產(chǎn)算力的極限挑戰(zhàn)
從表面上看,科大訊飛選擇“全棧自主可控”路線是出于中美競爭的地緣環(huán)境,兩次被美國列入實體清單,無法獲得英偉達芯片算力的“另辟蹊徑”,然而更深層次的內(nèi)里,人工智能競爭的實質(zhì)已經(jīng)算法與模型的性能優(yōu)劣,演變成算力/算法/應(yīng)用這一整條鏈接綜合能力的考驗。
因而科大訊飛從一開始就確定了“全棧自主可控”的方向,算力國產(chǎn)化,算法自研。
2023年5月,訊飛星火大模型發(fā)布,5個月后,首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”也宣布正式啟用。
2024年,在“飛星一號”算力平臺的支持下,訊飛星火大模型不斷升級,從V3.5到V4.0再到V4.0 Turbo,核心能力全面對標GPT-4 Turbo。
取得上述成績的背后是科大訊飛與華為共同攻克的技術(shù)無人區(qū)。自2023年5月起,雙方團隊在萬卡高速互聯(lián)組網(wǎng)、計算通信隱藏、訓(xùn)練推理強交互等關(guān)鍵領(lǐng)域取得突破,將昇騰910B的訓(xùn)練效率從最初相當(dāng)于英偉達A100的30%-50%提升至85%-95%。
今年1月,科大訊飛又發(fā)布了國內(nèi)首個基于全國產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型——訊飛星火X1。
這個僅130億參數(shù)的“小模型”實力“驚人”,在高考題、AIME競賽題和高中奧賽題解答中,不僅答案準確,還能提供接近人類“慢思考”的詳細解題步驟。
3個月后,科大訊飛與生態(tài)企業(yè)組成的聯(lián)合團隊通過多種優(yōu)化手段提升“飛星一號”平臺上 MoE 模型集群推理的性能上限,并實現(xiàn)大規(guī)模專家并行集群推理性能翻番,訊飛星火X1也由此迎來了全新升級,在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務(wù)上效果顯著提升。
科大訊飛的實踐充分證明了基于國產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實力和持續(xù)創(chuàng)新的潛力,與此同時,也在“自主可控”語境下,為中國的大模型行業(yè)提供了一條可供借鑒的破局之路。
02 應(yīng)用為王,從教育醫(yī)療到央國企的全面滲透
研發(fā)實現(xiàn)了“全棧自主可控”,其價值最終要體現(xiàn)在落地應(yīng)用上,科大訊飛的戰(zhàn)略是以“1+N”的形式進行業(yè)務(wù)體系布局, “1”是指通用底座大模型,“N”是指以底座大模型賦能教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個行業(yè)領(lǐng)域,并形成獨具優(yōu)勢的行業(yè)大模型。
比如,訊飛星火X1在教育場景中落地時,聯(lián)合中國教育科學(xué)研究院發(fā)布基于“問題鏈”的高中數(shù)學(xué)智能教師助手,在全國百個試點區(qū)域部署,與上千名優(yōu)秀教研員打造了上萬個優(yōu)秀案例。
在實際教學(xué)中,老師們發(fā)現(xiàn)X1在一題多解、教學(xué)知識關(guān)聯(lián)、拓展學(xué)生高階思維等方面表現(xiàn)出色。相關(guān)技術(shù)的融入,科大訊飛AI學(xué)習(xí)機的學(xué)習(xí)推薦和診斷也變得更加精準,解題思路和知識鏈條更加清晰。
在醫(yī)療領(lǐng)域,X1的模型策略已使專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控準確率達90%。科大訊飛還表示將在年內(nèi)發(fā)布基于X1的醫(yī)療大模型升級版,確保其深層次診斷推理效果業(yè)界領(lǐng)先。
更令人矚目的是在央國企市場的攻城略地,科大訊飛為央企打造的專業(yè)大模型已成為行業(yè)標桿。
與中國石油共建的昆侖大模型使代碼開發(fā)效率提升73%,行業(yè)知識問答采納率超95%;為國家能源集團開發(fā)的智能評標助手獲國資委點名表揚;與中海油合作的 “海能”人工智能模型已在招標采辦、員工健康等領(lǐng)域應(yīng)用,并正在研發(fā)海上油田穩(wěn)產(chǎn)增產(chǎn)等專業(yè)場景模型。
科大訊飛之所以能夠在IDC的報告中拿下去年央國企大模型解決方案市場份額第一,其核心原因在于滿足了產(chǎn)業(yè)應(yīng)用“既要又要還要”的需求,即工程能力與技術(shù)能力雙向驅(qū)動。
在具體實踐中,科大訊飛通過“通專結(jié)合、端云聯(lián)動與軟硬一體”(通用大模型與專業(yè)大模型結(jié)合、端側(cè)大模型與云端大模型聯(lián)動、軟硬件一體化)來實現(xiàn)部署成本與用戶體驗的平衡,提出“建算力、理數(shù)據(jù)、訓(xùn)模型,到落場景、保安全、精運營”的全鏈路方法,從場景出發(fā),給客戶提供人工智能的解決方案。
在工具層面上,科大訊飛進一步升級了模型定制優(yōu)化工具鏈,支持監(jiān)督微調(diào)、強化學(xué)習(xí)兩種模型定制優(yōu)化方案,持續(xù)簡化定制步驟和成本。
03 星火燎原后的硬仗與新征途
從上文的分析不難看出,科大訊飛不僅證明了國產(chǎn)算力登頂技術(shù)巔峰的實力,更為中國大模型行業(yè)開辟了一條可借鑒的破局路徑。然而,大模型行業(yè)的競逐正步入深水區(qū),訊飛面臨的考驗更為復(fù)雜。
其一,全球大模型正加速向多模態(tài)、強推理、高能效演進。昇騰910B效率雖追至A100的85%-95%,但面對英偉達H200等新一代芯片及集群效率的持續(xù)躍升,保持算力底座競爭力仍需在芯片互聯(lián)、訓(xùn)練框架、集群調(diào)度等“硬骨頭”上持續(xù)攻堅。
其二,大模型之爭終將演化為生態(tài)之爭,科大訊飛“1+N”戰(zhàn)略雖已鋪開,但相比互聯(lián)網(wǎng)巨頭在消費端的海量觸達和開發(fā)者生態(tài)號召力,其仍需在吸引廣大開發(fā)者、構(gòu)建繁榮的工具鏈與社區(qū)生態(tài)上傾注更多資源與開放誠意,避免成為“孤勇者”。
其三,行業(yè)落地已從“能用”邁向“好用且經(jīng)濟”,科大訊飛在央企、教育、醫(yī)療的標桿案例雖亮眼,但需將“通專結(jié)合、端云聯(lián)動”方法論沉淀為可快速復(fù)制的規(guī)模化能力,在確保“自主可控”前提下持續(xù)優(yōu)化部署成本與用戶體驗,實現(xiàn)商業(yè)價值的可持續(xù)閉環(huán)。
今年4月份的業(yè)績說明會上,科大訊飛官方認為,“目前底座大模型還有很大的增長空間,通過預(yù)訓(xùn)練和強化訓(xùn)練兩種方法,大模型的自主進化在未來2-3年內(nèi)還有巨大的提升空間,天花板非常高。”
科大訊飛董事長劉慶峰也表示,會繼續(xù)加大“1+N”的投入,搶抓通用人工智能的根紅利。“在完全自主可控的基礎(chǔ)上,我們的通用底座大模型要做到第一梯隊,永爭行業(yè)第一,不僅僅是跟隨,并推動更多算法研發(fā)和創(chuàng)新。”
很明顯,科大訊飛的挑戰(zhàn)主要來源于持續(xù)不斷的創(chuàng)新與投入和長盈利周期的平衡,好就好在,科大訊飛以篳路藍縷的實踐點燃了希望之火,至少在當(dāng)前這個時間節(jié)點,科大訊飛仍處于領(lǐng)跑的位置。
科大訊飛的未來如何,既取決于其在技術(shù)深水區(qū)持續(xù)攻堅的硬實力,也考驗其構(gòu)建開放生態(tài)、實現(xiàn)規(guī)模落地的軟智慧。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。