聯(lián)想今日宣布,旗下首款 AMD AI 大模型訓(xùn)練服務(wù)器——聯(lián)想問天 WA7785a G3在單機(jī)部署671B(滿血版) DeepSeek 大模型時,實(shí)現(xiàn)了高達(dá)6708token/s 的極限吞吐量,再次刷新了單臺服務(wù)器運(yùn)行超大規(guī)模模型性能的紀(jì)錄。
據(jù)介紹,此次性能突破得益于聯(lián)想萬全異構(gòu)智算平臺的強(qiáng)大支持。聯(lián)想通過訪存優(yōu)化、顯存優(yōu)化、創(chuàng)新的 PCIe5.0全互聯(lián)架構(gòu)以及精選 SGLang 框架中的最優(yōu)算子等一系列創(chuàng)新技術(shù)手段,對大模型從預(yù)訓(xùn)練、后訓(xùn)練到推理的全流程進(jìn)行了持續(xù)優(yōu)化。實(shí)測結(jié)果顯示,在單臺部署 DeepSeek671B 大模型的聯(lián)想問天 WA7785a G3服務(wù)器上,最高吞吐量達(dá)到了驚人的6708token/s。
在模擬問題對話場景(上下文序列長度128/1K)時,該服務(wù)器最高可支持158的并發(fā)數(shù),TPOT(Time Per Output Token)為93毫秒,TTFT(Time To First Token)為2.01秒;而在模擬代碼生成場景(上下文序列長度512/4K)時,并發(fā)數(shù)可達(dá)140,TPOT 為100毫秒,TTFT 為5.53秒。聯(lián)想方面表示,這一性能表現(xiàn)意味著單臺聯(lián)想問天 WA7785a G3服務(wù)器即可支撐1500人規(guī)模企業(yè)的正常使用,是繼聯(lián)想問天 WA7780G3服務(wù)器單機(jī)部署滿血版 DeepSeek 大模型總吞吐量突破2500token/s 之后,在單機(jī)部署該大模型推理性能上的又一次重大飛躍。
聯(lián)想方面強(qiáng)調(diào),此次技術(shù)突破是聯(lián)想中國基礎(chǔ)設(shè)施業(yè)務(wù)群、聯(lián)想研究院 ICI 實(shí)驗(yàn)室和 AMD 聯(lián)合設(shè)計、協(xié)同調(diào)優(yōu)、共同實(shí)現(xiàn)的成果。同時,這并非最終結(jié)果,聯(lián)想與 AMD 仍在持續(xù)探索深度調(diào)優(yōu)的新方法,以期實(shí)現(xiàn)更高的性能突破。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實(shí)、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計劃發(fā)布會。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。