首頁 > 云計算頻道 > 云計算

端側AI，如何化解國內算力之困？

2023年08月18日 14:15:16 舉大名耳來源：微信公眾號：AI新智能

　　解決了算力之困后，端側大模型將有可能*引爆本輪AI革命的盈利點。

　　算力和數據的天花板，決定了本輪的AI熱潮究竟能走多遠。

　　但不幸的是，對國內而言，其中的算力天花板，離“到頂”已經越來越近。

　　就在8月初，美簽署最新行政令，禁止美國對中國計算機芯片等敏感技術進行一些新投資，重點將在限制美國資本對于中國半導體設計軟件和制造硬件的投資。

　　此消息一出，不少人頓感：國內算力危矣!

　　而機警的大廠，也開始了各自未雨綢繆的準備。

　　《金融時報》的一篇報道稱，國內包括阿里、字節在內的科技巨頭，已經訂購50億美元的英偉達的A800芯片，來面對訓練大語言模型需要的算力挑戰。

　　按照此前媒體報道，目前中國企業GPU芯片持有量超過1萬枚的不超過5家，擁有1萬枚A100的至多1家。

　　那么，在愈發緊張的算力之下，中國AI的前途、命運將如何發展?

　　短期來看，算力之困對于業內，似乎是個無解的問題。然而，技術的發展，有時就像生物的進化，當一種技術在面臨“生存挑戰”時，也會由于選擇壓力而發生一系列的突變。

　　而對國內而言，這樣的突變方向，也許就是分散于各個終端里的端側大模型。

　　端側大模型，如何解算力之困？

　　端側大模型的發展，對國內算力突圍有著怎樣的意義?這還得從目前云計算的需求說起。

　　當下，面對大模型高昂的算力成本，許多致力于涉足AI領域，但卻算力匱乏的企業，往往都選擇了租用云算力的方式，來滿足訓練需求。

　　在此背景下，昇騰AI集群這樣的云服務平臺也趁勢而起，成為了孵化國內各個大模型的“母工廠”。

　　然而，即使是云計算本身，也需要大量的GPU支撐。

　　如果云服務商無法獲取足夠的GPU資源，那么它們也無法為國內AI企業提供高效、可靠的云計算服務。

　　而端側AI最重要的意義，就在于分擔了目前國內云計算的壓力。

　　倘若我們將十幾億分散的智能手機，當成了一個個潛在的、擁有大量閑置算力的移動計算單元，那么部署在手機中的端側AI，就能在這些設備閑置時間里，將這些碎片化、分布式算力利用起來，產生頗為可觀的規模效應。

　　具體來說，聯邦計算，就是這樣為人熟知的分布式計算方式之一。

　　所謂聯邦計算，簡而言之，就是在數據源(例如用戶設備)上進行模型的局部訓練，然后將這些局部模型的參數或更新聚合到中央服務器上，形成一個“全局模型”。

　　相比于集中式的訓練，這種分布式的方式可以更好地利用各個設備的計算能力，降低中央服務器的算力需求。

　　在這樣的過程中，依靠終端設備(例如手機)的龐大數量規模，每個“全局模型”的訓練成本，在無意中便被不斷攤薄了。

　　因為每個“小模型”的訓練只需要消耗端側設備的計算資源，而不需要傳輸大量的原始數據到云端。這樣，就可以節省網絡帶寬和云端存儲空間，也可以減少云端服務器的計算壓力。

　　更重要的是，與云端GPU這類高成本的訓練方式相比，由于端側AI芯片往往是針對特定的AI應用和算法，進行優化和定制，因此其往往有著相對更明確的“回血”途徑。

　　例如，前段時間，爆火的妙鴨相機，大家應該都聽說了。在其最受追捧的初期，成千上萬的用戶涌進應用中，高峰期一度有4000-5000人排隊，需要等待10多個小時才能出片。

　　之后，是阿里云進行了緊急擴容，才勉強應對了這暴漲數百倍的算力需求。

　　但倘若用戶不用在云端等待，而是直接在本地，或者通過端云協同的方式，就能實現這樣的生成效果呢?

　　一種可能的方式，是先在端側生成低分辨率的圖片，之后再上傳到云端，用較少的資源對圖片進行清晰化處理。

　　如此一來，既降低了云端算力的負擔，又在一定程度上保障了生成的質量、效率。

　　在當下的AI應用開發中，開發者不僅需要支付云端大模型API接口的成本，還得自己租用服務器，保證密鑰安全。

　　如果是文字生成類AI，文字量大的話，相應的token也是一筆不小的開支。

　　而隨著算力門檻的降低，眾多AI應用的開發者，將不再被云端算力的成本所縛，而只需調用端側大模型提供的開放API，就可以快速開發各類AI應用。

　　在此基礎上，一個開放的、多樣化的AI應用生態，就隨著端側大模型的普及，而應運而生了。

　　以“偏”補“全”的端側芯片

　　AI應用井噴的時代似乎近在眼前，但要想讓每臺手機都標配一個大模型，前面還有道難以回避的門檻——硬件基礎。

　　由于芯片架構不同，在端側部署時，往往需要對模型網絡結構進行一通修改才能勉強“上車”。

　　具體來說，目前GPT這類主流AI所使用的Transformer架構，往往部署于云端服務器。

　　這是因為GPU對于MHA結構(Transformer中的多頭注意力機制)計算支持更友好。而端側AI的芯片，則主要側重于CNN(卷積神經網絡)的結構。

　　如果將前者強行轉移到端側，帶來的一個明顯問題，就是模型精度下降。

　　那么有沒有什么辦法，能讓大模型在進行端側化改造的同時，仍能保證其精度呢?

　　愛芯元智推出的端側芯片AX650N，似乎提供了一個可能的路線。

　　AX650N芯片擁有自研混合精度NPU和愛芯智眸AI-ISP兩大核心技術，其對Transformer結構的網絡進行了專門的優化，在其NPU中增加了專門用于自注意力計算的單元，可以大幅提升Transformer網絡的運行速度和準確率。

　　憑借著這類針對端側的優化技術，AX650N已經做到了在端側部署原版Swin Transformer只需要5分鐘，而跑起私有模型，只要1個小時就能搞定。

　　但盡管如此，受限于架構和內存，這樣的優化，僅僅只是針對視覺大模型方向而言的，因為從硬件算力上來說，端側AI芯片，始終難以做到GPU芯片那樣“面面俱到”的通用性、兼容性。

　　既然如此，國內的大模型之困，是否就指望不上它了?

　　其實不然，從量的角度來講，邊緣側、端側的需求一定比云側更大，畢竟邊緣側、端側設備會更多。

　　而在這眾多的需求中，只要使用了大模型的終端(如手機、智能音箱)，能做到兩點，那么國內大模型在應用層，就有盤活的可能。

　　其中*點，就是夠降低人們獲取信息、知識的成本。

　　倘若以后人們打開手機或者其他終端，就能獲得一個諸如私人醫生和律師、廚師的AI助理，能為我們提供成本低廉、快速的咨詢服務，那么人們就會對其產生依賴。

　　因為從行為學上來說，人總歸是有惰性的。

　　雖然目前的某些律所，也能為人們提供免費的咨詢服務，但這其中卻包含了無形的時間成本、溝通成本。

　　正如互聯網出現后，雖然人們仍能通過紙制地圖進行導航，但大部分人卻再也離不開手機上的定位功能一樣。

　　從某種程度上說，壓縮了各種知識、智能的端側模型，將會重復這一過程。

　　第二點，則是個性化功能的普及。

　　在“前AI時代”，個性化定制的大規模推廣，是一件不可想象的事。

　　在沒有AI技術支持的情況下，實現個性化定制通常需要大量的人力和時間投入。為每個用戶提供個性化的產品或服務，往往需要大量的人工處理。

　　然而，隨著本輪AI革命的到來，人們已經在應用層，看到了AI用于個性化、定制化服務的可能。

　　例如character.Ai一類的應用，支持用戶根據自己的需求、偏好，量身定制一個“AI伴侶”。

　　試想一下，倘若這樣的定制化服務進入到了端側，端側大模型就能不斷收集用戶數據，再進行反饋、訓練，并最終打造出一個*的、貼身的AI助手。

　　而這樣量身定制的體驗，顯然比大規模的標準化服務，更具吸引力。

　　總結

　　盡管在模型規模、性能等方面，端側大模型目前還遠無法與云端大模型相比，但分布式的算力格局，以及龐大的規模效應，都將大大降低目前國內云端算力的負擔。

　　而在算力成本降低之后，大量基于API接口的AI應用，也得以通過一個個部署在本地的端側大模型不斷涌現。

　　在應用大爆發的背景下，一些捕捉到先機的應用，就會基于端側大模型實時響應、個性化定制的功能，引爆本輪AI革命真正的盈利點。

　　而這，正是無數人在這股AI浪潮中苦苦追尋的。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

海藝AI的模型系統在國際市場上廣受好評，目前站內累計模型數超過80萬個，涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景，基本覆蓋所有主流創作風格。

一加Ace 6T官宣：全球首發驍龍8 Gen5

真我GT8 Pro阿斯頓馬丁F1限量版開售，16GB+1TB售價5499元

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

9月9日，國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場，1H25》報告。中國AI云市場阿里云占比8%位列第一。

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

9月24日，華為坤靈召開“智能體驗，一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

雅馬哈昨日宣布推出兩款頭戴式耳機，分別是平板振膜的YH-4000和動圈原理的YH-C3000。

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告，2025年第二季度》顯示，上半年全球智能家居清潔機器人市場出貨1,2萬臺，同比增長33%，顯示出品類強勁的市場需求。

專題

禮儀主持_商業活動模特演藝服務公司
九章智算云Alaya NeW Cloud 2.0發布
中文科技資訊旗下IB科技資訊上線專
中文科技資訊關于我單位網站被仿冒一

返回主頁 ┊ 關于我們 ┊ 內容聯系 ┊ 聯系我們 ┊ 免責聲明 ┊ 原創新聞 ┊ 門戶版

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

端側AI，如何化解國內算力之困？

最新新聞

熱門新聞

即時

全球頂級AI創作社區回歸！海藝AI國內首發“全民娛樂化創作

新聞

市場占比高達35.8%，阿里云引領中國AI云增長

企業IT

華為坤靈發布IdeaHub千行百業體驗官計劃，助力中小企

3C消費

雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

研究

IDC：2025上半年全球智能家居清潔機器人出貨量同比暴

專題

端側AI，如何化解國內算力之困？

擴展閱讀

最新新聞

熱門新聞

端側AI，如何化解國內算力之困？