價格戰的硝煙似乎還沒有平息,但 AI 廠商們的又一場戰爭已經開始。
這一次的競爭核心是大模型應用開發。根據 IDC 報告,2023年中國大模型平臺及相關應用市場規模約還僅有區區17.65億元人民幣,但伴隨著行業的巨變,2024年,模型應用開發相關的產業規模預計將會上漲至百億級別,各行各業對于 AI 技術、模型應用的重視前所未有。
“今天我們接觸到的所有客戶、所有開發者、所有 CTO,幾乎都在用 AI 重構自己的產品。”在2024云棲大會上,阿里巴巴集團 CEO、阿里云智能集團董事長兼 CEO 吳泳銘也在主題演講中印證了這一事實。在更垂直的一些領域,包括汽車制造、生物醫藥、工業仿真、氣象預測、等行業,AI 大模型都在加速滲透。一場新產業革命正在轟轟烈烈卻又默不作聲地演進著。
而對于百度智能云、火山引擎、阿里云等廠商來說,大模型上游側對于算力、底座大模型開發的攻城略地已經進入白熱化,囤好了“糧”,一場產業下游的“跑馬圈地”也即將開始。AI Agent、RAG、模型訓推、工作流編排..... 新的技術革新故事正被傳頌著,對于廠商們來說,大模型等技術終于來到了實踐驗證的階段。這將是一場刺刀見紅的“廝殺”,養兵千日,用兵一時,針對爆炸式增長的需求,誰能推出更好用的平臺產品,誰似乎就抓住了 AI 技術發展的下一個機會。
如同 IOS 與安卓的競爭一樣,生態即是關鍵,在規模法則愈加應驗的今天,抓住更多行業的數智化浪潮,為自身壘砌護城河,已經成為關鍵。但許多問題仍縈繞在人們心中:市場對于大模型應用開發的核心需求是什么?對于廠商來說,怎樣才能打贏這場“戰爭”,站在“紫禁之巔”?
1搶占先機!誰抓住了大模型應用開發,誰就抓住了未來?
大模型技術何以應用?關鍵在于對數據要素價值的進一步挖掘,借助大模型強大的數據處理能力和深度學習能力,數據信息等生產要素的使用效率進一步提高,并借助新的生成方式作用于企業生產業務與經營決策中,通過更深層次的“數智化”,賦能不同的生產場景。
根據前瞻產業研究院發布的《2024中國 AI 大模型場景探索及應用報告》,大模型技術在金融、政務、教育等領域的滲透率均超過50%,借助生成式 AI 等能力,智能客服、智能營銷、智能搜索等通用場景的應用成熟度逐漸增高,在醫療、制造、電商等領域,改變也在同步發生,包括英特爾、百度在內的軟硬件廠商們正在不斷布局這些行業領域,希望將大模型能力進一步融入進相關場景業務中,通過針對性的垂直應用產品提升業務效率。
“風口”已經到來,但對于許多企業來說,想要自如的運用大模型的能力,卻并沒那么簡單。首先是算力瓶頸問題,高性能硬件資源的高昂成本和專業管理需求對許多企業構成了壓力。其次,不同系統和框架之間的兼容性問題也增加了額外的開發工作和技術支持需求,人才緊缺也制約了企業大模型應用開發的腳步。此外,企業還需要關注模型的構建、訓練、優化、部署和維護等多個層面的需求,這又在無形中增加了成本。
所有行業,都需要性能更強、規模更大、更適應 AI 需求的基礎設施,并將其作用于應用開發之中,于是 AI 獨角獸、云廠商們開始持續發力。
目前,國內外主要的 AI 大模型廠商均推出了大模型應用開發平臺或相應的產品矩陣,在國外,OpenAI 開發者平臺、亞馬遜云科技的 Bedrock,Azure AI Studio 風頭正勁,在國內,百度智能云的千帆生態、字節跳動的火山方舟等也備受關注,而最近阿里云也同樣在大模型應用開發領域作出了新的部署,這也進一步引起了全行業的關注。
2024云棲大會上,阿里云宣布其主攻大模型應用開發的兩大產品——大模型服務平臺百煉和人工智能平臺 PAI 也迎來了新的升級:阿里云百煉進一步增強⼯作流與智能體的流程編排能⼒,同時也發布了百煉2.0專屬版本,專⻔針對政企客戶做了使⽤優化;⼈⼯智能平臺 PAI,已實現萬卡級別的訓練推理⼀體化彈性調度,AI 算⼒有效利⽤率超90%,進一步提升了大模型工程開發能力。這無疑是阿里云為建立 AI 開發和應用落地全棧能力的又一個重要布局。
對于許多企業來說,在數智化升級的前期,相關需求并不明晰,其使用的產品就需要覆蓋更多元的功能與調用能力,而百煉和 PAI 即可滿足企業在大模型應用開發中的多樣化需求。
百煉依托阿里云的 AI 基礎設施,提供全面的模型應用開發工具,支持企業通過 prompt 構建 Agent 和 RAG 系統,實現模型功能的快速接入與應用構建。PAI 則提供構建和定制大模型的能力,滿足企業從0到1構建大模型或深度定制模型的需求。無論是模型調用、應用開發還是模型開發,借助百煉和 PAI 的產品能力,企業基本能夠實現模型功能在大模型領域的全棧落地。
百煉與 PAI 的能力就在于,其真正將“應用開發”的全部能力整合進產品中,并通過邏輯清晰的封裝與靈活易用的特性增強其開發能力。這也有針對性地解決了諸多大模型應用開發平臺所面臨的問題:單個工具的使用門檻并不高,但整體構建的框架與工作流并不清晰,致使大模型應用開發陷入困頓。真正的模型應用開發,不是簡單的開發一個 Agent,或是孤立的 RAG 系統,而是能夠由淺入深,真正構建出一款大模型應用,從而“一站式”地滿足企業的數智化升級需要,以及多元的業務需求。
2破解成本與效率的迷局:如何讓模型應用開發物有所值?
AI 的盡頭是算力,盡管這是一句老生常談,但在市場數據的支持下,我們不得不承認這一點。
隨著 AI 大模型技術的迅猛發展,算力市場也在經歷劇烈的變化。企業對大模型應用的需求不斷增加,推動了對高性能計算資源的需求,尤其是 GPU 的需求,供不應求一度成為常態。時間來到2024年,AI 算力市場的供需關系逐漸平衡,部分 GPU 和 AI 服務器價格有所回調,NVIDIA ***和 RTX4090的租賃價格在10個月內下降了50%,***的8卡節點年租賃價格從12-18萬元降至約7萬元。盡管如此,高端 GPU 如 A100仍供不應求,價格較高。國產 AI 芯片逐步崛起,但短期內難以大幅緩解供應壓力。
在2024AI Hardware Summit 上,微軟云計算 AI 和高級系統副總裁 Zaid Kahn 在演講中提到,目前模型訓練的計算需求與關鍵基礎設施之間存在日益擴大的差距,訓練計算量每年增長4.2倍,而內存帶寬增長1.26倍,互連帶寬增長1.18倍,算力、傳輸等技術的解鎖已經成為目前行業發展的繞不過的關隘,整個行業需要系統性的革新。2024云棲大會上,阿里云 CTO 周靖人也直言,算力供不應求的情況客觀存在。
巨變仍需等待,算力資源等成本的居高不下,一直讓大模型走向應用落地的步伐走得不是很暢快。這也為模型廠商的價格戰提供了“土壤”,借助規模優勢與技術創新,AI 服務背后的算力成本被進一步稀釋,但對于很多企業來說,投入產出比仍舊是目前入局大模型應用開發的核心考慮因素,誰能用更低的價格提供更多的資源,幫助企業解決性價比問題,誰就能盡可能地占據更多的市場份額。
如何開源節流,技術創新為上策。對于云廠商們來說,首先就是充分利用自己的規模優勢,Scaling Law 不僅在大模型的深度學習與訓推中能夠發揮作用,同樣可以能夠在大模型應用開發中發光發熱。
縱觀全球 AI 及云計算廠商,只有阿里云和 Google Cloud Platform(GCP)同時擁有云基礎設施和自研大模型開發的能力,其中阿里云作為中國唯一提供 AI 全棧產品與服務的公司,不斷升級其底層計算、存儲、網絡等基礎設施,為 AI 計算業務提供了超大規模、超強性能的智能算力。其靈駿集群能夠支持單集群十萬卡級別的 AI 算力規模,萬卡規模性能線性度超過96%,網絡帶寬利用率超過99%,并行存儲吞吐達到20TB/s。這進一步為阿里云的大模型應用開發服務提供了深厚的算力基礎。
另一方面,模型產品的多樣性也在不斷豐富,百煉能提供包括通義千問在內的主流大模型的調用服務,借助30萬 + 企業客戶的不斷調用,調用成本不斷降低,同時模型也借助生態的規模優勢不斷調優,讓模型的能力更加精準,附加多模態、全尺寸等全面的產品功能,也讓企業對于資源的利用率進一步提高,讓算力資源能夠更加有的放矢。
企業在使用云計算資源時,往往會選擇比實際需求更大的實例規格,以應對潛在的高峰負載。這種做法雖然能確保在高峰期不出現資源不足的情況,但在大部分時間里,這些資源處于閑置狀態,導致算力浪費。例如,根據調查,約40% 的組織云計算規模是實際需求的兩倍。
與此同時,在目前萬卡集群等境況下,異構計算技術的不完善會導致大規模的算力浪費;在異構計算環境中,不同規格、版本的芯片混用時,如何高效協同工作是一個挑戰,如果處理不當,也會造成資源的浪費;在多租戶的企業級深度學習場景中,不同用戶會提交不同框架的深度學習作業,這些作業對資源的需求各不相同,如果沒有有效的資源管理和調度系統,也會導致資源的浪費。
另一方面,對于模型訓練來說,出現訓練錯誤的情況時常發生,如果沒有及時的糾偏補全,模型訓練就有可能從頭開始,此前訓練使用的算力資源也就被白白浪費。
針對這些情況,以阿里云為代表的云廠商們都在探索如何將單卡的算力發揮到極致,如何讓大規模集群的資源利用更加科學,不少廠商都喊出了“打造全新的 AI 基礎設施”的口號。以人工智能平臺 PAI 為例,其借助高性能的 AI 工程平臺,能夠全鏈路的支撐數據處理、開發、訓練等各個環節,結合訓推異構化的趨勢,其能夠實時根據業務負載、模型結構、資源類型的變化進行優化,實現萬卡級別的訓練推理一體化彈性調度,讓異構計算下的不同芯片“捆成一股繩”,可以真正實現“指哪打哪”。
同時,通過云原生的統一調度引擎,統一管理,讓多種異構算力、不同的卡型、廠商,動態的調度并且無感的切換任務,充分利用碎片化的算力資源,比如在大企業調用大規模卡群資源的同時,其中部分的碎片化的資源開放給開發者去使用,做小型任務的處理,讓整個阿里云的算力資源能夠充分被調動。據悉,目前阿里云 AI 有效算力已經實現了十倍以上的提升,有效算力利用率達到了百分之九十以上。
基于算力利用率的提升,基于百煉和 PAI 這樣的平臺,企業、開發者夠輕松無負擔的用上萬卡、十萬卡集群資源,但不用將精力放在資源的管理調度之上,讓大模型應用開發不僅在性價比方面突破桎梏,還進一步的隱藏了其復雜性,讓行業的數智化發展更專注,更聚焦。
3拋棄噱頭,返璞歸真,“好用、能用”才是模型應用開發平臺的核心競爭力?
回歸到市場本身,當準入門檻被時間抹平,成本難題被想方設法攻克,最終決定成敗的“彈藥”仍舊是產品本身,以往的優勢固然重要,但只有真正讓大模型技術作用于業務場景中,讓應用開發真正切實可行,才是破局的關鍵。
總結當下的大模型應用開發平臺及產品,基本都遵循了相同的技術架構,圍繞模型供應,模型精調與訓練、Agent 搭建,RAG 知識庫、工作流編排、Prompt 指引等核心功能與關鍵環節展開,不同點主要在于產品框架的不同以及調用模型的不同。如何才能拉開差距?核心就在于實用性。
以阿里云百煉為例,作為供應模型數最多的平臺之一,除了阿里云的通義千問主流模型之外,還有很多開源第三方模型以及行業大模型,在多樣化模型的支持下,不同行業的企業可以從專業的行業大模型中調用服務,通義大模型則提供應用搭建的相關能力,輔以三方大模型的服務運維,可以結合實際情況,進行更深入的大模型能力調用。在模型本身的能力角度,在百煉服務升級后搭載了降價版本的通義千問 PLus 版本與 Turbo 版本,分別滿足性能與性價比的需要。除此之外,百煉還提供多模態、全尺寸的模型服務,進一步擴展了模型應用的功能選擇。
更重要的是,百煉還同步提供多樣化的開發范式,“手把手”的幫助企業開發應用,結合細顆粒度、低門檻的工作流編排,通過 prompt 指引、案例參考、反饋優化等方式助力企業的開發進程,這對于缺乏 AI 團隊與開發者的企業來說至關重要。在目前市場頗為關注的 RAG(檢索增強)領域,相對于市面上其他的產品,百煉也進行了進一步的靈活優化,讓 RAG 深度融入進了應用開發的各個環節中,進一步發揮企業自身的數據價值,讓專業數據融入應用中,實現與模型能力的有機融合。
除此之外,模型幻覺問題對于應用的服務效果也有極大的影響,可監測的精細化運營或許是解決方法之一。針對這一問題,百煉的每個模塊都將受到質量監控,通過多樣化的實時指標持續優化應用。為此,阿里云還提供了一個支持全鏈路管理和分析的平臺,其支持自動和人工評測,助力企業客戶針對不同模塊進行優化,無論是 SFT 數據還是應用效果,確保模型應用可觀測、可分析、可評價,并可進行干預。
在模型開發層面,數據加工和處理在大模型發展中變得至關重要,模型能力提升往往源于數據差異。針對這一問題,人工智能平臺 PAI 在基礎模型方面,新增了系數模型、混合專家模型和多模態模型的 Diffusion Transformer 支持。模型訓練上,強化了強化學習、DPO、模型蒸餾和小樣本學習的支持,并集成了數據處理與效果評測,實現大模型開發端到端覆蓋,進一步簡化了傳統復雜的大模型數據處理流程。
針對目前日益增大的模型規模與數據量,PAI 還提供多模態數據處理能力,包括視頻理解、圖像處理、關鍵幀提取、圖像和視頻壓縮等。整個流程從預訓練數據處理到預訓練模型,再到微調和服務,清晰展示和追蹤數據模型依賴關系,結合 PAI 的推理服務的升級以及靈活的資源調度模式,進一步減輕了模型開發人員負擔。
這一切,歸根到底是洞察了企業客戶的需求,并在持續創新中完善相關能力,讓產品更好用,更易用,進一步實現企業 - 數據 - 模型的良性循環。基于需求,持續創新,最終保持先進,這樣的產品思路同時也融入進了阿里云的 AI 產品創新與業務運營之中。
以阿里云推出的系列產品推薦計劃“飛天星品”為例,其旨在通過產品推薦讓廣大企業、開發者能夠在多達數百款云產品中,根據自身業務問題,快速定位關鍵產品需求,輕松選到最好用、最高性價比、最適合自己的云產品。
深入業務,供需結合,才能真正讓好的產品有的放矢,不僅在大模型應用開發領域,對于阿里云這樣的頭部 AI 廠商來說,真正結合生態,基于企業和開發者的真實需求幫助其解決問題,才是 AI 廠商長久發展的立足之本。
4結語
在當前階段,我們對于 AGI 似乎觸手可得,但又遙不可及。大模型應用開發,尤其是以阿里云百煉和 PAI 為代表的技術,為我們提供了一種可能的路徑。通過深入分析行業趨勢和未來,我們可以看到,深度結合實踐需求、精細化、低門檻的產品方向,以及重視投入產出比,已經成為行業發展的核心要素。在這一背景下,單純的技術進步已不再是唯一的驅動力,如何將技術轉化為實際的業務價值,才是保持先進的關鍵。
同時,基于阿里云等頭部廠商的實踐,我們也能洞察到“AI 重構”的重要性。無論是云原生技術、算力、訓推一體化,AI 都在引領一場全面的變革。這場變革從“計算”的“虛”出發,走向“業務”的“實”,意味著 AI 技術正在從單純的計算能力轉變為推動業務創新和轉型的核心動力,助力企業打造面向 AI 時代的原生應用與服務,加速業務智能化升級,已經成為廠商們目前階段的核心使命。
當然,這是一個風口,一個機會,也將開啟廠商之間一場又一場的激烈競爭,大模型應用開發和 AI 重構不僅是技術層面的突破,更將是一場針對商業模式和產業實踐的深刻變革。但無論如何,走上牌桌才是關鍵,正如吳泳銘在2024云棲大會上所說的那樣:“我們認為生成式 AI 將逐漸滲透數字世界,并接管數字世界。”對于所有入局者來說,這是一場不容錯過的技術革命。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。