過去幾個月,行業(yè)用戶對大模型的關(guān)注經(jīng)歷了從天馬行空的想象,到組建團(tuán)隊尋找場景。大模型企業(yè)也從百模大戰(zhàn),到競相落地布局。
文|周路平 徐鑫
編|石兆
國內(nèi)大模型戰(zhàn)場的比拼正在進(jìn)入新的階段。
過去2個月,大模型市場上異常熱鬧,不同參數(shù)級別和能力類型的大模型紛紛內(nèi)測。如何降低大模型使用門檻,讓大模型真正在行業(yè)里用起來,是企業(yè)用戶和大模型提供商關(guān)注的焦點。
5月9日,國內(nèi)最早開始大模型產(chǎn)品內(nèi)測的百度,公布了企業(yè)級大模型平臺“文心千帆”內(nèi)測的消息。在推動大模型落地行業(yè)上,百度邁出了關(guān)鍵一步。
01
大模型競爭進(jìn)入新階段
最近兩個月,百度集團(tuán)副總裁侯震宇感受到了大模型賽道的有趣變化。之前過來接觸的人,級別都非常高,大多是CEO,交流的內(nèi)容也以科普為主。大家都覺得大模型很重要,害怕掉隊。但現(xiàn)在,來的大部分是企業(yè)內(nèi)部具體做事的人,他們希望盡快將大模型在業(yè)務(wù)中落地,以獲取競爭優(yōu)勢。
“這是個好事,說明大模型已經(jīng)逐步邁向?qū)嶋H落地階段。”侯震宇說,外界對大模型的關(guān)注經(jīng)歷了從天馬行空的想象到探討如何落地的階段。
從國外廠商的動作來看,這一趨勢的轉(zhuǎn)變已經(jīng)越來越明顯。阿里云此前內(nèi)測通義千問大模型時,就同步推出了企業(yè)和行業(yè)大模型,并聯(lián)合7家行業(yè)伙伴探索大模型在油氣、電力、交通、金融等多個行業(yè)的應(yīng)用。商湯、第四范式等人工智能廠商也在智能汽車領(lǐng)域、醫(yī)療、企服軟件開發(fā)摸索大模型的場景。
海外最受關(guān)注的是微軟的路徑。由于與OpenAI在資金、技術(shù)和應(yīng)用落地場景有深度合作,微軟步子邁得大。在C端產(chǎn)品如搜索引擎Bing上,大模型讓應(yīng)用從工具向智能助手轉(zhuǎn)變,目前Bing的活躍用戶增加到了1億水平。在微軟能力強項ToB領(lǐng)域,“智能副駕”Copilot已經(jīng)與微軟已有的低代碼開發(fā)工具、Office辦公軟件、CRM、ERP軟件以及網(wǎng)絡(luò)安全等多款產(chǎn)品結(jié)合,完成產(chǎn)品的智能化升級。
其中代碼生成平臺Github和office產(chǎn)品的智能智能助手推出在行業(yè)里引起了不小的轟動。
國內(nèi)企業(yè)服務(wù)市場幾位行業(yè)人士不同程度向數(shù)智前線表達(dá)過焦慮情緒。隨著大模型能力引入相關(guān)賽道,企服產(chǎn)品服務(wù)客戶的方式和競爭點可能也會發(fā)生變化,他們需要密切關(guān)注。
國內(nèi)最早推出大模型產(chǎn)品內(nèi)測的百度此前也一直與大量企業(yè)探索應(yīng)用場景。百度公布的數(shù)據(jù),有超過300家生態(tài)伙伴參與內(nèi)測,在400多個企業(yè)內(nèi)部場景取得測試成效。大模型內(nèi)測后,百度開了3場面向企業(yè)客戶的大模型技術(shù)交流會,每場都人員爆滿。這也反映了當(dāng)下企業(yè)們迫切想了解大模型在細(xì)分場景里的方案。但也有用戶反映,希望看到更有確定性的機會。
最新的消息是,文心大模型技術(shù)交流日上,百度披露了正在聯(lián)合企業(yè)客戶、生態(tài)合作伙伴內(nèi)測的“文心千帆大模型平臺”,以未來滿足企業(yè)客戶研發(fā)和使用大模型的需求。
文心千帆大模型平臺不但提供包括文心一言在內(nèi)的大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套可視化工具鏈,包括數(shù)據(jù)生成、標(biāo)注、回流的數(shù)據(jù)閉環(huán)管理功能。客戶以少量數(shù)據(jù)即可發(fā)起模型微調(diào),最快幾分鐘就可獲得自己的專屬大模型。
目前,百度自身已有的相關(guān)產(chǎn)品已率先開始基于文心千帆大模型平臺進(jìn)行智能化升級。同時,基于大量用戶交流與反饋,百度將大模型應(yīng)用的場景提煉成了通用應(yīng)用和行業(yè)應(yīng)用兩類。
通用類包含了智能創(chuàng)作平臺、數(shù)字人技術(shù)和生成、知識管理和檢索、對話系統(tǒng)以及智能客服等適用于所有行業(yè)的場景。在此之上,金融、政務(wù)、工業(yè)、媒體、電商零售等多個行業(yè),是百度智能云所覆蓋的重要戰(zhàn)略場景。
為了能更好的在行業(yè)落地,百度也在積極打造合作伙伴生態(tài)。5月9日的交流會上,百度與聯(lián)想集團(tuán)、用友、寶蘭德等14家文心千帆生態(tài)伙伴簽約,繼續(xù)推進(jìn)大模型的行業(yè)場景落地。
業(yè)界觀察,這些生態(tài)伙伴在企業(yè)服務(wù)的細(xì)分市場,有大量數(shù)據(jù)積累和行業(yè)實踐沉淀,對百度在細(xì)分行業(yè)場景里形成能力補充。
例如,老牌企業(yè)服務(wù)提供商用友,在企業(yè)數(shù)智化轉(zhuǎn)型領(lǐng)域積累了數(shù)百萬企業(yè)客戶的人財物項、產(chǎn)供銷研等10大領(lǐng)域和眾多行業(yè)的應(yīng)用實踐;寶蘭德是國內(nèi)電信行業(yè)國產(chǎn)中間件市場的頭部廠商,在中間件、智能運維等行業(yè)通用軟件及數(shù)智化產(chǎn)品解決方案有豐富經(jīng)驗。
業(yè)內(nèi)認(rèn)為,豐富的實踐和碰撞,能幫助大模型實現(xiàn)產(chǎn)品、技術(shù)和應(yīng)用場景間的良性互動。
“真正能夠把大模型在垂直行業(yè)做好,是目前各個企業(yè)都要考慮的問題。”智能運維企業(yè)寶蘭德董事長說,讓大模型的能力落地是接下來大模型發(fā)展的一個非常關(guān)鍵的步驟。
02
大模型ToB的兩條腿
作為企業(yè)級大模型生產(chǎn)平臺,百度給文心千帆的定位是大模型生產(chǎn)和分發(fā)的集散地。文心千帆平臺上,不但提供包括文心一言在內(nèi)的大模型服務(wù)及第三方大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套工具鏈。
企業(yè)既可以直接用百度預(yù)訓(xùn)練的文心大模型,還可以基于平臺訓(xùn)練自己專屬的大模型,百度文心千帆大模型平臺提供的兩種不同商業(yè)模式,也契合了當(dāng)前企業(yè)對大模型的不同需求。
百度內(nèi)部形象地將兩者比作為“操作系統(tǒng)模式”和“臺積電模式”。所謂操作系統(tǒng),是指文心一言大模型扮演了AI時代操作系統(tǒng)的角色,企業(yè)只需要在文心一言大模型的基礎(chǔ)上,注入少量行業(yè)知識數(shù)據(jù)進(jìn)行微調(diào),用很小成本就能得到自己的專屬大模型,就像開發(fā)者在安卓開發(fā)App一樣。
臺積電模式指的是百度提供高效穩(wěn)定的全套基礎(chǔ)設(shè)施和豐富的工具鏈,讓客戶到文心千帆大模型平臺來訓(xùn)練他們自己的大模型,訓(xùn)練出來之后再交付給客戶,就好比芯片設(shè)計企業(yè),拿著設(shè)計好的圖紙,交給臺積電流片制造。
但這兩種模式,都非常考驗平臺能否提供一套簡單易用的工具鏈。
“中國企業(yè)關(guān)注大模型的落地能力。”用友副總裁、研究院院長呂建偉說,外界雖然演示了很多大模型的應(yīng)用場景,但背后的加工過程非常復(fù)雜,比如需要做提示詞,需要做模板,有很多的工作需要去做,“如何能把這些很復(fù)雜的,像微調(diào)、提示調(diào)優(yōu)、指令調(diào)優(yōu)、強化學(xué)習(xí)的功能,從工具層面再降低一個層級(非常重要)”。
以大模型訓(xùn)練和應(yīng)用最常見的微調(diào)為例,它能低成本地對模型進(jìn)行修正,用于改進(jìn)預(yù)訓(xùn)練模型的性能,以適應(yīng)新的任務(wù)。
呂建偉直言,當(dāng)下訓(xùn)練大模型經(jīng)常遇到兩個極端:要么是不能進(jìn)行很好地微調(diào)和性能調(diào)優(yōu),大模型跑起來就沒法停下來;要么需要花費上千萬元,去重新訓(xùn)練。
技術(shù)交流日當(dāng)天,百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理昕舟在百度智能云BI產(chǎn)品sugar上,現(xiàn)場演示了文心大模型的微調(diào)全過程。sugar主要提供數(shù)據(jù)可視化,幫助客戶做商業(yè)分析和決策,已接入了文心一言的能力。
“展示一下各個地區(qū)的銷售額”,第一個指令通過輸入框下達(dá),全程不需要任何專業(yè)的技能,很快系統(tǒng)就反饋出一個餅狀圖,有對應(yīng)的百分比和銷售額。
“統(tǒng)計華北地區(qū)2019年3月到5月的銷售額,用折線圖來表示。”需求開始變得復(fù)雜,而系統(tǒng)也沒有返回結(jié)果。
這也是很多通用大模型會遇到的問題:如何通過小樣本數(shù)據(jù)的投喂,讓大模型變得更加聰明和強大。很快,昕舟將準(zhǔn)備好的100條高質(zhì)量精標(biāo)數(shù)據(jù),投喂給大模型。在小樣本的微調(diào)下,系統(tǒng)很快掌握了技能,準(zhǔn)確返回了結(jié)果。
微調(diào)教會了大模型在特定的應(yīng)用中學(xué)會特定的指令和要求,并且還能具備一定的泛化能力。這也是業(yè)內(nèi)訓(xùn)練大模型的常見做法。
除了微調(diào),目前,文心千帆大模型平臺包含了大模型生產(chǎn)和應(yīng)用的完整生命周期要具備的功能和工具,從底層的AI異構(gòu)算力、高性能文件系統(tǒng)、高速網(wǎng)絡(luò)和AI調(diào)度增強,到海量的數(shù)據(jù)處理、高質(zhì)量的數(shù)據(jù)標(biāo)注、強化學(xué)習(xí),再到大模型的評估、高效的壓縮、自動化的Prompt工程和快速的應(yīng)用編排。千帆大模型平臺考慮到了大模型從開發(fā)、應(yīng)用到調(diào)優(yōu)的每一個環(huán)節(jié)。
另外,文心千帆大平臺也支持插件。ChatGPT在推出Plugins(插件)功能時,外界一片驚呼,它能將ChatGPT連接到第三方應(yīng)用程序。
除了訓(xùn)練和應(yīng)用大模型,不同的業(yè)務(wù)需求對大模型的部署方式也提出了要求。當(dāng)下,外界普遍認(rèn)為公有云是一個非常高效的應(yīng)用方式,但不少企業(yè)尤其是政企客戶,出于數(shù)據(jù)安全和合規(guī)考慮,都會要求私有化部署。
“中國ToB市場,很多大企業(yè)要求私有化部署,但大模型的私有化部署其實很復(fù)雜,有很多局限性。”呂建偉說,如果要把大模型分發(fā)給中國上萬家的大型企業(yè),如何很容易地分發(fā)部署,部署的工具在哪里都是業(yè)內(nèi)所關(guān)注的問題。
目前,包括百度、華為和阿里在內(nèi)的廠商都在提供公有云服務(wù)和私有化部署兩種交付模式。
以百度文心千帆為例,它的部署方式則更加靈活,對外將提供了“3+3”的交付方式。公有云服務(wù)上提供推理(直接調(diào)用大模型的推理能力)、微調(diào)(通過高質(zhì)量精標(biāo)業(yè)務(wù)數(shù)據(jù),高效訓(xùn)練出特定行業(yè)的大模型)、托管(將模型發(fā)布在百度智能云,以實現(xiàn)更加穩(wěn)定高效的運行)三種服務(wù)。
私有化部署上,文心千帆大模型平臺也提供了三種部署方式:包括支持軟件授權(quán)(提供在企業(yè)環(huán)境中運行的大模型服務(wù))、軟硬一體(提供整套大模型服務(wù)及對應(yīng)的硬件基礎(chǔ)設(shè)施)、租賃服務(wù)(提供機器和平臺的租賃滿足客戶低頻需求)。
據(jù)數(shù)智前線獲悉,租賃服務(wù)是百度智能云最新增加的部署方式,目的是滿足部分客戶對模型訓(xùn)練的低頻需求,相比于去采購大量的資源和機器,租賃會更劃算。
公有云和私有化結(jié)合的靈活多樣的部署方式,將加快大模型在企業(yè)業(yè)務(wù)中的應(yīng)用。
03
成本壓力下,全棧底座的優(yōu)勢
隨著業(yè)界普遍將通用人工智能視為歷史性的機遇。不少企業(yè)紛紛開始訓(xùn)練自己的大模型,被業(yè)內(nèi)稱為“百模大戰(zhàn)”。但并不是每一家企業(yè)都要從零到一去訓(xùn)練大模型,一般企業(yè)既沒有這個能力,也沒這個必要,“我想開車,不需要自己去造車”。
“我們不應(yīng)該自己去做大模型,我們把自己定位在大模型的最佳應(yīng)用方。”金山辦公助理總裁田然直言,文心一言發(fā)布后的第一時間,金山辦公就聯(lián)系了百度,開啟了內(nèi)測。
這是一個非常現(xiàn)實的考量。金山辦公CEO章慶元此前在接受采訪時也提到,“我的核心競爭力還在Office本身。所以我一定要跟進(jìn)最好的大模型,誰好我就用誰。我就做大模型的應(yīng)用者。”
其實,無論是自己去訓(xùn)練大模型,還是接入大廠提供的大模型服務(wù),成本都是其中非常重要的考量。
華為此前透露,大模型開發(fā)和訓(xùn)練一次的成本高達(dá)1200萬美元,背后是大量資源和算力的消耗。而即便是調(diào)用類似ChatGPT的方式,GPT-3.5模型的API價格為0.002美元/千token,GPT-4在請求方面的API價格為0.06美元/千token。對于很多企業(yè)而言,這也是一筆難以承受的成本。
田然提到,金山辦公有數(shù)億用戶,如果這些用戶都用上大模型的能力,將會帶來巨大的成本壓力。所以,成本也是金山辦公在使用大模型時非常關(guān)注的地方。“百度大模型的推理性能和推理的成本是有一些優(yōu)勢的。”田然說。
侯震宇表示:”最終能夠讓大模型服務(wù)推廣開的只有兩個原因:第一個是模型效果,第二個是成本。”
事實上,百度大模型的調(diào)用和訓(xùn)練成本一直在下降。文心一言開啟內(nèi)測后,一個月就迭代了四次。根據(jù)百度之前披露的數(shù)據(jù),文心一言的推理成本如今只有發(fā)布之初的十分之一,而3個月內(nèi)的推理效率提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。
侯震宇透露,除了推理成本下降,在接下來幾個月,不管是在模型使用,還是在模型微調(diào)甚至在模型再訓(xùn)練方面,“價格應(yīng)該不會成為大家使用或者擁抱大模型的瓶頸”。
這得益于百度打造的國內(nèi)首個全棧自研的AI基礎(chǔ)設(shè)施“百度AI大底座”,它面向企業(yè)AI開發(fā)提供端到端的解決方案,從芯片、框架、模型和應(yīng)用進(jìn)行了全棧布局。
正如侯震宇所言,大模型時代下,企業(yè)不但需要智能的算力、靈活的框架平臺、豐富的大模型體系以及優(yōu)質(zhì)的應(yīng)用方案,還需要這四層技術(shù)架構(gòu)之間的適配與優(yōu)化,這是一個“既要、又要、還要”的端到端創(chuàng)新工程。
這是百度AI大底座在大模型訓(xùn)練上的優(yōu)勢所在:芯片層的昆侖芯、框架層的飛槳和模型層的文心大模型家族。每一層均有行業(yè)領(lǐng)先的產(chǎn)品,可以形成一個高效的反饋閉環(huán),幫助大模型不斷去調(diào)優(yōu)迭代。尤其在框架層和模型層之間,AI大底座有很強的協(xié)同作用,可以幫助企業(yè)構(gòu)建更高效的模型,持續(xù)調(diào)優(yōu)性能,并顯著降低成本。
“大家可能會覺得堆積算力、寫好代碼、然后進(jìn)行模型訓(xùn)練,把它跑起來就行了。實際上在訓(xùn)練過程中會遇到各種各樣的挑戰(zhàn),很少有人能夠使得一個大模型訓(xùn)練過程能夠在連續(xù)一兩天內(nèi)不出問題。”百度智能云云計算產(chǎn)品解決方案和運營部總經(jīng)理宋飛說,“百度AI大底座可以為大模型提供高效、穩(wěn)定的訓(xùn)練和有效的收斂。”
根據(jù)百度披露的數(shù)據(jù),百度AI大底座的千卡加速比達(dá)到90%,資源利用率達(dá)到70%,開發(fā)效率提升100%。如果不是全棧布局,很難獲得這樣的效果。
除了效率和成本,安全合規(guī)也是企業(yè)選擇大模型的一大前提。田然提到,金山辦公與百度大模型團(tuán)隊對接后,討論的第一個問題就是安全合規(guī)。
而國內(nèi)企業(yè)對國產(chǎn)化自主可控也有很高的要求。“雖然中國有很多個機器學(xué)習(xí)的框架,他們也都是支持國產(chǎn)化的系統(tǒng),軟硬件,也都是開源,但飛槳的開源知識社區(qū),是我們評估來做得最好的一個。”呂建偉坦言。
大模型被認(rèn)為是AI發(fā)展的分水嶺,已經(jīng)在等政務(wù)、工業(yè)、金融、傳媒等領(lǐng)域的辦公協(xié)同、智能客服、文案生成、工業(yè)質(zhì)檢等場景下展現(xiàn)出了威力,無論是對現(xiàn)有產(chǎn)品的改造,還是創(chuàng)新場景的探索,大模型都在打開全新的想象空間。需求已經(jīng)涌現(xiàn),只不過,市場的需求注定是碎片化的,企業(yè)的大規(guī)模應(yīng)用還有待時日。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。