在當(dāng)今科技迅速發(fā)展的背景下,大型語言模型(LLM)在多個行業(yè)中扮演著重要角色,幫助自動化任務(wù)和提升決策效率。然而,在芯片設(shè)計等專業(yè)領(lǐng)域,這些模型面臨著獨特的挑戰(zhàn)。NVIDIA 最近推出的 ChipAlign 正是為了應(yīng)對這些挑戰(zhàn)而設(shè)計,旨在將通用指令對齊的 LLM 與芯片特定的 LLM 的優(yōu)勢相結(jié)合。

ChipAlign 采用了一種新的模型合并策略,這一策略無需進(jìn)行繁瑣的訓(xùn)練過程,借助幾何空間中的測地線插值方法,能夠順暢地將兩種模型的能力融合在一起。與傳統(tǒng)的多任務(wù)學(xué)習(xí)方式相比,ChipAlign 直接將預(yù)訓(xùn)練的模型結(jié)合,避免了對大量數(shù)據(jù)集和計算資源的需求,從而有效保留了兩種模型的優(yōu)點。
具體而言,ChipAlign 通過一系列精心設(shè)計的步驟來實現(xiàn)效果。首先,它將芯片特定和指令對齊的 LLM 的權(quán)重投影到一個單位 n 球面上,接著沿著最短路徑進(jìn)行測地線插值,最后對融合后的權(quán)重進(jìn)行重新縮放,以確保其原有特性得以保持。這一創(chuàng)新方法帶來了顯著的提升,包括在指令跟隨基準(zhǔn)測試中提升了26.6% 的表現(xiàn)。

在實際應(yīng)用中,ChipAlign 在多個基準(zhǔn)測試中展現(xiàn)了其出色的性能。在 IFEval 基準(zhǔn)測試中,它實現(xiàn)了26.6% 的指令對齊提升;在 OpenROAD QA 基準(zhǔn)測試中,較其他模型合并技術(shù),ChipAlign 的 ROUGE-L 分?jǐn)?shù)提高了6.4%。此外,在工業(yè)芯片質(zhì)量保證(QA)中,ChipAlign 也以8.25% 的優(yōu)勢超越了基線模型,表現(xiàn)出色。
NVIDIA 的 ChipAlign 不僅解決了芯片設(shè)計領(lǐng)域的痛點,還展示了如何通過創(chuàng)新的技術(shù)手段來縮小大型語言模型能力的差距。該技術(shù)的應(yīng)用不僅限于芯片設(shè)計,未來有望推動更多專業(yè)領(lǐng)域的進(jìn)步,展現(xiàn)出可適應(yīng)且高效的 AI 解決方案的巨大潛力。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。