算力封鎖下的逆襲，國產(chǎn)推理大模型的崛起與征途

2025年07月02日 11:59:41 辰紋來源：洞見新研社

　　國產(chǎn)大模型深水區(qū)，登頂之后的算力、生態(tài)與規(guī)模新挑戰(zhàn)。

　　今年年初，DeepSeek橫空出世，讓世界重新認識了中國大模型。

　　幾乎在DeepSeek爆紅的同一時間，科大訊飛發(fā)布了全國產(chǎn)算力平臺上首個深度推理大模型——訊飛星火X1，其獨一無二的標簽是“唯一基于全國產(chǎn)算力訓(xùn)練的深度推理模型”。

　　1萬張華為昇騰910B國產(chǎn)算力卡，訓(xùn)練出的星火X1在模型參數(shù)比業(yè)界同類小一個數(shù)量級的情況下，整體效果卻能對標OpenAI o1和DeepSeek R1。

　　在曠日持久的科技賽跑中，科大訊飛用實際行動走出了一條自主可控，雖然艱辛，但更值得夸贊大模型發(fā)展路線。

　　01 技術(shù)突圍，國產(chǎn)算力的極限挑戰(zhàn)

　　從表面上看，科大訊飛選擇“全棧自主可控”路線是出于中美競爭的地緣環(huán)境，兩次被美國列入實體清單，無法獲得英偉達芯片算力的“另辟蹊徑”，然而更深層次的內(nèi)里，人工智能競爭的實質(zhì)已經(jīng)算法與模型的性能優(yōu)劣，演變成算力/算法/應(yīng)用這一整條鏈接綜合能力的考驗。

　　因而科大訊飛從一開始就確定了“全棧自主可控”的方向，算力國產(chǎn)化，算法自研。

　　2023年5月，訊飛星火大模型發(fā)布，5個月后，首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”也宣布正式啟用。

　　2024年，在“飛星一號”算力平臺的支持下，訊飛星火大模型不斷升級，從V3.5到V4.0再到V4.0 Turbo，核心能力全面對標GPT-4 Turbo。

　　取得上述成績的背后是科大訊飛與華為共同攻克的技術(shù)無人區(qū)。自2023年5月起，雙方團隊在萬卡高速互聯(lián)組網(wǎng)、計算通信隱藏、訓(xùn)練推理強交互等關(guān)鍵領(lǐng)域取得突破，將昇騰910B的訓(xùn)練效率從最初相當(dāng)于英偉達A100的30%-50%提升至85%-95%。

　　今年1月，科大訊飛又發(fā)布了國內(nèi)首個基于全國產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型——訊飛星火X1。

　　這個僅130億參數(shù)的“小模型”實力“驚人”，在高考題、AIME競賽題和高中奧賽題解答中，不僅答案準確，還能提供接近人類“慢思考”的詳細解題步驟。

　　3個月后，科大訊飛與生態(tài)企業(yè)組成的聯(lián)合團隊通過多種優(yōu)化手段提升“飛星一號”平臺上 MoE 模型集群推理的性能上限，并實現(xiàn)大規(guī)模專家并行集群推理性能翻番，訊飛星火X1也由此迎來了全新升級，在數(shù)學(xué)、代碼、邏輯推理、文本生成、語言理解、知識問答等通用任務(wù)上效果顯著提升。

　　科大訊飛的實踐充分證明了基于國產(chǎn)算力訓(xùn)練的全棧自主可控大模型具備登頂業(yè)界最高水平的實力和持續(xù)創(chuàng)新的潛力，與此同時，也在“自主可控”語境下，為中國的大模型行業(yè)提供了一條可供借鑒的破局之路。

　　02 應(yīng)用為王，從教育醫(yī)療到央國企的全面滲透

　　研發(fā)實現(xiàn)了“全棧自主可控”，其價值最終要體現(xiàn)在落地應(yīng)用上，科大訊飛的戰(zhàn)略是以“1+N”的形式進行業(yè)務(wù)體系布局， “1”是指通用底座大模型，“N”是指以底座大模型賦能教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個行業(yè)領(lǐng)域，并形成獨具優(yōu)勢的行業(yè)大模型。

　　比如，訊飛星火X1在教育場景中落地時，聯(lián)合中國教育科學(xué)研究院發(fā)布基于“問題鏈”的高中數(shù)學(xué)智能教師助手，在全國百個試點區(qū)域部署，與上千名優(yōu)秀教研員打造了上萬個優(yōu)秀案例。

　　在實際教學(xué)中，老師們發(fā)現(xiàn)X1在一題多解、教學(xué)知識關(guān)聯(lián)、拓展學(xué)生高階思維等方面表現(xiàn)出色。相關(guān)技術(shù)的融入，科大訊飛AI學(xué)習(xí)機的學(xué)習(xí)推薦和診斷也變得更加精準，解題思路和知識鏈條更加清晰。

　　在醫(yī)療領(lǐng)域，X1的模型策略已使專科輔助診斷和復(fù)雜病歷內(nèi)涵質(zhì)控準確率達90%。科大訊飛還表示將在年內(nèi)發(fā)布基于X1的醫(yī)療大模型升級版，確保其深層次診斷推理效果業(yè)界領(lǐng)先。

　　更令人矚目的是在央國企市場的攻城略地，科大訊飛為央企打造的專業(yè)大模型已成為行業(yè)標桿。

　　與中國石油共建的昆侖大模型使代碼開發(fā)效率提升73%，行業(yè)知識問答采納率超95%;為國家能源集團開發(fā)的智能評標助手獲國資委點名表揚;與中海油合作的 “海能”人工智能模型已在招標采辦、員工健康等領(lǐng)域應(yīng)用，并正在研發(fā)海上油田穩(wěn)產(chǎn)增產(chǎn)等專業(yè)場景模型。

　　科大訊飛之所以能夠在IDC的報告中拿下去年央國企大模型解決方案市場份額第一，其核心原因在于滿足了產(chǎn)業(yè)應(yīng)用“既要又要還要”的需求，即工程能力與技術(shù)能力雙向驅(qū)動。

　　在具體實踐中，科大訊飛通過“通專結(jié)合、端云聯(lián)動與軟硬一體”(通用大模型與專業(yè)大模型結(jié)合、端側(cè)大模型與云端大模型聯(lián)動、軟硬件一體化)來實現(xiàn)部署成本與用戶體驗的平衡，提出“建算力、理數(shù)據(jù)、訓(xùn)模型，到落場景、保安全、精運營”的全鏈路方法，從場景出發(fā)，給客戶提供人工智能的解決方案。

　　在工具層面上，科大訊飛進一步升級了模型定制優(yōu)化工具鏈，支持監(jiān)督微調(diào)、強化學(xué)習(xí)兩種模型定制優(yōu)化方案，持續(xù)簡化定制步驟和成本。

　　03 星火燎原后的硬仗與新征途

　　從上文的分析不難看出，科大訊飛不僅證明了國產(chǎn)算力登頂技術(shù)巔峰的實力，更為中國大模型行業(yè)開辟了一條可借鑒的破局路徑。然而，大模型行業(yè)的競逐正步入深水區(qū)，訊飛面臨的考驗更為復(fù)雜。

　　其一，全球大模型正加速向多模態(tài)、強推理、高能效演進。昇騰910B效率雖追至A100的85%-95%，但面對英偉達H200等新一代芯片及集群效率的持續(xù)躍升，保持算力底座競爭力仍需在芯片互聯(lián)、訓(xùn)練框架、集群調(diào)度等“硬骨頭”上持續(xù)攻堅。

　　其二，大模型之爭終將演化為生態(tài)之爭，科大訊飛“1+N”戰(zhàn)略雖已鋪開，但相比互聯(lián)網(wǎng)巨頭在消費端的海量觸達和開發(fā)者生態(tài)號召力，其仍需在吸引廣大開發(fā)者、構(gòu)建繁榮的工具鏈與社區(qū)生態(tài)上傾注更多資源與開放誠意，避免成為“孤勇者”。

　　其三，行業(yè)落地已從“能用”邁向“好用且經(jīng)濟”，科大訊飛在央企、教育、醫(yī)療的標桿案例雖亮眼，但需將“通專結(jié)合、端云聯(lián)動”方法論沉淀為可快速復(fù)制的規(guī)模化能力，在確保“自主可控”前提下持續(xù)優(yōu)化部署成本與用戶體驗，實現(xiàn)商業(yè)價值的可持續(xù)閉環(huán)。

　　今年4月份的業(yè)績說明會上，科大訊飛官方認為，“目前底座大模型還有很大的增長空間，通過預(yù)訓(xùn)練和強化訓(xùn)練兩種方法，大模型的自主進化在未來2-3年內(nèi)還有巨大的提升空間，天花板非常高。”

　　科大訊飛董事長劉慶峰也表示，會繼續(xù)加大“1+N”的投入，搶抓通用人工智能的根紅利。“在完全自主可控的基礎(chǔ)上，我們的通用底座大模型要做到第一梯隊，永爭行業(yè)第一，不僅僅是跟隨，并推動更多算法研發(fā)和創(chuàng)新。”

　　很明顯，科大訊飛的挑戰(zhàn)主要來源于持續(xù)不斷的創(chuàng)新與投入和長盈利周期的平衡，好就好在，科大訊飛以篳路藍縷的實踐點燃了希望之火，至少在當(dāng)前這個時間節(jié)點，科大訊飛仍處于領(lǐng)跑的位置。

　　科大訊飛的未來如何，既取決于其在技術(shù)深水區(qū)持續(xù)攻堅的硬實力，也考驗其構(gòu)建開放生態(tài)、實現(xiàn)規(guī)模落地的軟智慧。

　　文章內(nèi)容僅供閱讀，不構(gòu)成投資建議，請謹慎對待。投資者據(jù)此操作，風(fēng)險自擔(dān)。

海報生成中...