本文來自于微信公眾號 羅超Pro(ID:uochaotmt),作者:羅超。
11月8日,2023年世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會開幕。世界互聯(lián)網(wǎng)大會早已成為國內(nèi)規(guī)格最高的科技盛事,是展現(xiàn)全球數(shù)字經(jīng)濟(jì)最新科技成果的舞臺,是觀察數(shù)字經(jīng)濟(jì)潮水奔涌方向的瞭望臺,堪稱數(shù)字經(jīng)濟(jì)風(fēng)向標(biāo)。在生成式人工智能掀起新一輪技術(shù)革命的2023年,烏鎮(zhèn)峰會具備承前啟后的獨特意義。
大模型成烏鎮(zhèn)峰會關(guān)鍵詞
隨著ChatGPT、文心一言等產(chǎn)品的爆紅,AI大模型在科技行業(yè)掀起了滔天巨浪。預(yù)訓(xùn)練大模型、生成式人工智能也成了今年烏鎮(zhèn)峰會的核心議題之一。
在世界互聯(lián)網(wǎng)大會人工智能工作組與百度聯(lián)合主辦的“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇上,世界互聯(lián)網(wǎng)大會人工智能工作組發(fā)布了由其編寫的研究報告及共識文件,匯總產(chǎn)業(yè)界在金融、交通、教育等14個應(yīng)用場景的相關(guān)案例,提出“發(fā)展負(fù)責(zé)任的生成式人工智能十條共識”。
AI大模型在烏鎮(zhèn)峰會上的強(qiáng)勢存在不只是在論壇上有所體現(xiàn)。作為烏鎮(zhèn)峰會的官方核心活動,“世界互聯(lián)網(wǎng)領(lǐng)先科技成果發(fā)布活動”在7年后全面升級成“世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎”。今年的獲獎項目大都與AI有關(guān),來自互聯(lián)網(wǎng)企業(yè)的兩個獲獎項目均屬于AI范疇:一個是位列“基礎(chǔ)技術(shù)組”的“百度知識增強(qiáng)大語言模型關(guān)鍵技術(shù)”,另一個是屬于“工程研發(fā)組”的“騰訊覓影數(shù)智醫(yī)療影像平臺”,其中百度“知識增強(qiáng)大語言模型關(guān)鍵技術(shù)”是唯一獲獎的大模型技術(shù)。
百度“知識增強(qiáng)大語言模型關(guān)鍵技術(shù)”領(lǐng)先在何處?據(jù)百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰在現(xiàn)場介紹,“人工智能正在引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革,大語言模型讓人們看到了通用人工智能的曙光。知識增強(qiáng)大語言模型關(guān)鍵技術(shù),突破知識內(nèi)化和外用技術(shù),具備知識增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)的獨有技術(shù)優(yōu)勢,并通過模型與框架聯(lián)合優(yōu)化,突破了訓(xùn)練規(guī)模,提高了訓(xùn)練效率,提升了模型效果。”
今年3月百度發(fā)布知識增強(qiáng)大語言模型文心一言,其具備知識增強(qiáng)、檢索增強(qiáng)和對話增強(qiáng)等技術(shù)優(yōu)勢。5月文心一言的基礎(chǔ)模型升級至文心大模型3.5。8月31日文心一言率先全面開放。10月的世界大會上百度發(fā)布了文心大模型4.0,在理解、生成、邏輯、記憶四大能力都有顯著提升,綜合能力與GPT-4相比毫不遜色。
2023年,除早已入局大模型的百度外,阿里、華為等科技巨頭以及多家創(chuàng)業(yè)公司均跑步入局大模型賽道,“百模大戰(zhàn)”如火如荼。群雄逐鹿下,大模型賽道也出現(xiàn)了一些怪亂象,一些玩家在資本加持下臨時上陣做大模型甚至一股腦“梭哈”,有的實力不濟(jì)也做基礎(chǔ)大模型“重復(fù)發(fā)明輪子”,有的“渾水摸魚”為了市場炒作強(qiáng)推大模型,更有連核心技術(shù)都依靠第三方的“皮包型大模型公司”在湊熱鬧。其實在眾聲喧嘩下,大模型真正重要的只有兩件事:
第一件事是基礎(chǔ)大模型的技術(shù)提升,說得更直白一點就是要有能擔(dān)綱與GPT抗衡的基礎(chǔ)大模型。在科技自主自立的大時代背景下,這一點至關(guān)重要;另一件事是大模型的落地,如果不能應(yīng)用到實際場景中,大模型狂卷參數(shù)“軍備競賽”無意義,畢竟技術(shù)只有解決實實在在的問題才有價值。
發(fā)展大模型應(yīng)該基礎(chǔ)技術(shù)提升與產(chǎn)業(yè)場景落地并重,這正是百度的“大模型觀”。
早在2019年百度就已在積累AI預(yù)訓(xùn)練模型技術(shù)并上線文心大模型,當(dāng)年7月文心大模型升級至2.0,2021年12月正式發(fā)布全球首個知識增強(qiáng)千億大模型鵬城-百度·文心,參數(shù)規(guī)模2600億。
在行業(yè)因為ChatGPT關(guān)注大模型的前一年,百度就在布局大模型且堅持“不卷參數(shù)卷落地”,腳踏實地地推動大模型的落地且提出建設(shè)性方案。2022年5月,在WAVE SUMMIT2022深度學(xué)習(xí)開發(fā)者峰會上,百度公布飛槳文心大模型最新全景圖,提出支撐大模型產(chǎn)業(yè)落地的3個關(guān)鍵路徑并在業(yè)內(nèi)首發(fā)基于文心大模型的行業(yè)大模型,構(gòu)建了一套適宜產(chǎn)業(yè)應(yīng)用的大模型體系,同時提供了配套的工具平臺、推動開放生態(tài)促創(chuàng)新。
重視場景落地與重視基礎(chǔ)技術(shù)并不矛盾,百度深知提升基礎(chǔ)大模型技術(shù)水平的重要性。2023年百度文心大模型加快升級步伐,除不斷汲取數(shù)據(jù)與知識提升智能水平外,通過在輸入與輸出環(huán)節(jié)進(jìn)行知識點增強(qiáng),在基礎(chǔ)大模型上引入智能體機(jī)制等手段,提高模型的效率與效果。文心大模型成唯一斬獲“世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎”的大模型技術(shù)也足以表明,百度在基礎(chǔ)大模型技術(shù)上的絕對領(lǐng)先性。尤為重點的一點是,更強(qiáng)的文心大模型進(jìn)步更快,據(jù)王海峰10月發(fā)布文心大模型4.0時介紹,在9月小流量上線后,過去一個多月其效果又提升近30%。
基礎(chǔ)大模型能力不斷提升進(jìn)而呈現(xiàn)越來越強(qiáng)勁的智能涌現(xiàn),這給大模型落地到更多應(yīng)用場景、催生出更多創(chuàng)新應(yīng)用、發(fā)揮出更大的智能價值創(chuàng)造了前提條件。在百度世界大會上,李彥宏提出“AI原生應(yīng)用”的理念,引導(dǎo)開發(fā)者重新思考人與機(jī)器的交互模式并重新設(shè)計AI原生應(yīng)用,突破傳統(tǒng)互聯(lián)網(wǎng)應(yīng)用的價值邊界,加速大模型在工作、學(xué)習(xí)、生活、商業(yè)、娛樂等場景的大規(guī)模落地。如同App的應(yīng)用形態(tài)帶來移動互聯(lián)網(wǎng)的大繁榮一樣,AI原生應(yīng)用正在催生一個龐大繁榮的AI生態(tài)。
正如烏鎮(zhèn)峰會“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇的主題所示,人工智能最終價值是賦能產(chǎn)業(yè)發(fā)展,加速千行百業(yè)的數(shù)字化進(jìn)程,促進(jìn)人類社會全面邁向智能化新階段。大模型良性競爭的核心應(yīng)該回到基礎(chǔ)大模型技術(shù)進(jìn)化與大模型技術(shù)落地應(yīng)用這兩個重點上來。
文心加飛槳共赴星河
大模型不是AI浪潮的起點,而是AI浪潮的延續(xù),但不可否認(rèn)的是,AI浪潮被其推到了全新高度。
大模型并非突然出現(xiàn)的顛覆性技術(shù),其更準(zhǔn)確地稱呼是“預(yù)訓(xùn)練大模型”,“預(yù)訓(xùn)練”字面意思很容易理解:預(yù)先訓(xùn)練好,其通過堆疊數(shù)據(jù)集“貪婪式”地訓(xùn)練模式,擁有較強(qiáng)的通用性,理論上可泛化到多種應(yīng)用場景,而小樣本或零樣本的技術(shù)實現(xiàn),則可讓開發(fā)者可快速基于其構(gòu)建AI應(yīng)用,而不再需要從0到1訓(xùn)練數(shù)據(jù)、建立模型。
在大模型技術(shù)出現(xiàn)前,AI技術(shù)就已出現(xiàn)60余年。10余年來,隨著深度學(xué)習(xí)技術(shù)的高速發(fā)展,AI技術(shù)如知識圖譜、機(jī)器視覺、語音、自動駕駛等早已被廣泛應(yīng)用。當(dāng)AI要實現(xiàn)工業(yè)化大生產(chǎn)時,AI要支撐更加廣泛普適的場景,要支撐更大更復(fù)雜的AI計算需求,要實現(xiàn)智能水平的不斷升級,依靠傳統(tǒng)訓(xùn)練模式已無法滿足,大模型生逢其時。
作為深度學(xué)習(xí)的全新突破,大模型讓AI技術(shù)的通用性大幅提升,成為AI從作坊式應(yīng)用邁向工業(yè)化生產(chǎn)的關(guān)鍵。不過,大模型不是平地起高樓,它站在深度學(xué)習(xí)巨人的肩上,兩者一起驅(qū)動著智能經(jīng)濟(jì)的爆發(fā)。
在烏鎮(zhèn)峰會“人工智能賦能產(chǎn)業(yè)發(fā)展”分論壇上,王海峰在題為《文心加飛槳 翩然赴星河》的主題演講中,詮釋了深度學(xué)習(xí)框架與大模型的關(guān)系:“深度學(xué)習(xí)作為人工智能的核心技術(shù),具有很強(qiáng)的通用性,并具備標(biāo)準(zhǔn)化、自動化和模塊化的工業(yè)大生產(chǎn)特征,而大模型的興起,使得人工智能應(yīng)用的深度和廣度進(jìn)一步拓展。人工智能已進(jìn)入工業(yè)大生產(chǎn)階段。”
深度學(xué)習(xí)與大模型是協(xié)同促進(jìn)的關(guān)系。百度認(rèn)為,生成式AI和大模型的智能涌現(xiàn),帶來了全新的計算范式,這使得整個IT的技術(shù)棧從原來的三層,變成包括芯片、框架、模型、應(yīng)用在內(nèi)的四層結(jié)構(gòu)。
在智能時代的四層IT架構(gòu)中,芯片層,百度有昆侖等面向AI計算的芯片技術(shù)布局;框架層,有飛槳深度學(xué)習(xí)這樣的平臺;在模型層,則有文心大模型家族(包括文心大模型4.0在內(nèi)的自然語言處理方向的基礎(chǔ)大模型,視覺、跨模態(tài)、生物計算等其他方面的大模型,以及眾多的行業(yè)大模型)來克服機(jī)器訓(xùn)練的難題;在應(yīng)用層,則涌現(xiàn)出智能搜索、智能交通等原生AI應(yīng)用,互相協(xié)同的四層技術(shù)棧構(gòu)成AI時代的通用計算架構(gòu)。
大模型依賴于軟硬件的協(xié)同,向下離不開框架層與芯片層的支持,向上則要通過AI原生應(yīng)用落地到千行百業(yè)。深度學(xué)習(xí)框架飛槳就作為底座支持了文心大模型的訓(xùn)練、推理與部署。在萬卡算力上運行的飛槳平臺,通過集群基礎(chǔ)設(shè)施和調(diào)度系統(tǒng)、飛槳框架的軟硬協(xié)同優(yōu)化,支持了大模型的穩(wěn)定高效訓(xùn)練。正是通過飛槳與文心的協(xié)同優(yōu)化,文心大模型周均訓(xùn)練有效率超過98%,訓(xùn)練算法效率提升到3月發(fā)布時的3.6倍,推理性能提升50倍,由此可見,文心大模型4.0的強(qiáng)勁表現(xiàn),離不開飛槳深度學(xué)習(xí)平臺的底層加持。
在大模型加強(qiáng)AI通用性的同時,深度學(xué)習(xí)在不斷精進(jìn),變得越來越標(biāo)準(zhǔn)化、自動化和模塊化,更強(qiáng)大的深度學(xué)習(xí)平臺驅(qū)動著更強(qiáng)大的大模型,加速AI在千行百業(yè)落地。因此長期來看,“文心+飛槳”這樣的CP式AI組合,才是更適合AI工業(yè)化大生產(chǎn)的解決方案。
10年之約,百度準(zhǔn)備好了
烏鎮(zhèn)峰會第十年。10年來的世界互聯(lián)網(wǎng)大會上,百度出鏡率高,且與其相關(guān)的主題有且只有一個:AI。
除今年奪得“世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎”的文心大模型4.0以及2019年入選“世界互聯(lián)網(wǎng)大會領(lǐng)先成果”的飛槳深度學(xué)習(xí)平臺外,百度還有多個項目入選前些年的世界互聯(lián)網(wǎng)大會領(lǐng)先成果:百度大腦、DuerOS(小度助手)對話式人工智能操作系統(tǒng)、Apollo,每一個都屬于AI技術(shù)。
烏鎮(zhèn)峰會走過的十年,正值數(shù)字經(jīng)濟(jì)騰飛的十年。十年間世事變遷,斗轉(zhuǎn)星移。參與烏鎮(zhèn)峰會的數(shù)字經(jīng)濟(jì)企業(yè)從2014年的12家增加到2023年的過千家,互聯(lián)網(wǎng)行業(yè)格局早已是滄海桑田,層出不窮的新技術(shù)徹底改變了人們的生活乃至世界的面貌,數(shù)字經(jīng)濟(jì)重心已從“在線經(jīng)濟(jì)”全面轉(zhuǎn)移到“智能經(jīng)濟(jì)”。作為烏鎮(zhèn)峰會十年來的重要參與者與親歷者,置身數(shù)字經(jīng)濟(jì)中心的百度已從互聯(lián)網(wǎng)企業(yè)蛻變成AI公司,成為中國AI產(chǎn)業(yè)的扛旗者。
十年,彈指一揮間,百度AI泛舟已十年,AI信仰不曾改變。
不論是布局深度學(xué)習(xí)還是加碼大模型,百度都不做“追風(fēng)逐浪”的玩家,它將AI當(dāng)信仰,對AI的價值十分篤定,對AI的發(fā)展路線從無絲毫動搖,一直在力所能及地推動AI朝著正確的方向發(fā)展,做“造浪者”而不是“逐浪者”。
百度AI起步于2010年,經(jīng)過多年的技術(shù)積累和市場應(yīng)用,已經(jīng)取得了令人矚目的成果。2013年百度深度學(xué)習(xí)實驗室成立,與谷歌開始布局AI的時間一致。百度做AI最初就有很高的起點,2014年就已大舉在全球范圍尋覓頂尖人才。
技術(shù)的投機(jī)主義者會審時度勢,根據(jù)環(huán)境的變化調(diào)整投資策略。百度則是AI技術(shù)的信仰型玩家,在AI產(chǎn)業(yè)陷入低潮的2020年前后,李彥宏對AI技術(shù)的篤定也未曾動搖,他對AI此志不渝,也將樂觀的情緒傳遞給行業(yè)。在2020年世界人工智能大會上,李彥宏在演講中表示,“當(dāng)前,人們對人工智能的態(tài)度產(chǎn)生迷茫甚至悲觀,這是顛覆性技術(shù)在加速普及前的必經(jīng)階段。迷霧終將散去,智能經(jīng)濟(jì)和智能社會終將成為現(xiàn)實,而人類終將掌握自己的命運。”他當(dāng)時動情地表示:“我對AI的信仰,沒有絲毫改變。”
十年,百度AI技術(shù)不斷開花結(jié)果,終于登頂“珠峰”。
百度AI技術(shù)體系在深度學(xué)習(xí)基礎(chǔ)上延展出自然語言處理、圖像識別、語音識別、知識圖譜等領(lǐng)先的人工智能技術(shù),并積淀形成飛槳深度學(xué)習(xí)平臺、文心大模型。親自主導(dǎo)和參與這一系列技術(shù)體系的王海峰已成百度首席技術(shù)官,并繼續(xù)帶領(lǐng)百度科學(xué)家與工程師們在深度學(xué)習(xí)平臺、大模型等自主AI技術(shù)上深耕。百度財報顯示從2012年到2022年的十年間其在AI上已投資超過千億,自上而下構(gòu)建出覆蓋芯片、云計算平臺、飛槳深度學(xué)習(xí)平臺、大模型以及上層垂直AI技術(shù)應(yīng)用在內(nèi)的全棧AI架構(gòu)。
堅定投資AI是百度攀登技術(shù)珠峰的過程,道阻且難且長,十年終于登頂,與全球頂尖AI巨頭們相見于頂峰再論劍。
十年,百度做AI都堅持“基礎(chǔ)技術(shù)提升與產(chǎn)業(yè)場景落地”并重。
在持續(xù)投入深度學(xué)習(xí)平臺飛槳、基礎(chǔ)大模型文心等AI基礎(chǔ)技術(shù)的同時,百度積極地推動AI技術(shù)落地。
一方面,百度將AI技術(shù)應(yīng)用到每一個業(yè)務(wù)的“毛細(xì)血管”。除持續(xù)用AI重塑搜索、地圖、文庫、網(wǎng)盤等國民級應(yīng)用外,還成功開創(chuàng)了小度、Apollo等全新業(yè)務(wù)線。
另一方面,百度積極構(gòu)建開放的AI生態(tài),與社會力量與資源一起推動AI落地。從飛槳深度學(xué)習(xí)平臺到文心大模型,核心技術(shù)成熟一個開放一個。截至目前飛槳和文心生態(tài)已凝聚800萬開發(fā)者,服務(wù)22萬家企事業(yè)單位基于飛槳創(chuàng)建了80萬個模型。除技術(shù)開放外,百度積極推動AI產(chǎn)學(xué)研協(xié)同和人才培養(yǎng),在2020年提出5年為全社會培養(yǎng)500萬AI人才,現(xiàn)已培養(yǎng)420萬AI人才。在百度世界大會上,百度發(fā)布人才培養(yǎng)星河計劃,計劃再培養(yǎng)500萬大模型人才。
在AI工業(yè)化大生產(chǎn)階段,百度的開放只會更加徹底。在烏鎮(zhèn)峰會上,面對大模型產(chǎn)業(yè)化的挑戰(zhàn),王海峰表示,類似芯片代工廠模式,可采用“集約化生產(chǎn),平臺化應(yīng)用”的模式,即具有算法、算力和數(shù)據(jù)綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復(fù)雜過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù),這正是百度在大模型技術(shù)開放上努力的方向。
十年,AI從實驗室進(jìn)入到工業(yè)化大生產(chǎn)階段,百度準(zhǔn)備好了一切。
在繁榮的AI技術(shù)生態(tài)基礎(chǔ)上,AI應(yīng)用早已在全面落地。烏鎮(zhèn)景區(qū)十年的劇變就是AI一日千里的“縮影”。記得在2016年世界互聯(lián)網(wǎng)大會前夕,百度就在烏鎮(zhèn)景區(qū)推出了全球首個無人駕駛體驗站,筆者也有幸成為全球第26名體驗百度無人車的乘客。
除無人車這樣的黑科技服務(wù)外,烏鎮(zhèn)景區(qū)已實現(xiàn)刷臉進(jìn)園、掃臉入住、智能布草、智能床墊、語音導(dǎo)覽、智慧停車等智慧景區(qū)服務(wù),居民的生活與游客的體驗因為AI而徹底改變。
如果我們將目光從烏鎮(zhèn)放大到中國乃至世界來看,AI應(yīng)用更是層出不窮地出現(xiàn)在人們的身邊,給生活、學(xué)習(xí)、工作帶來諸多好處,給人類創(chuàng)造更多的福祉。
在烏鎮(zhèn)峰會期間,光明網(wǎng)記者孔繁鑫在《十年之約,烏鎮(zhèn)準(zhǔn)備好了》一文中對烏鎮(zhèn)峰會十年進(jìn)行了生動的復(fù)盤。正如他在文中所說,“十年斗轉(zhuǎn)星移,互聯(lián)網(wǎng)的江湖波云詭譎,話題從網(wǎng)絡(luò)安全、金融監(jiān)管切換到數(shù)據(jù)治理、人工智能,烏鎮(zhèn)卻總能穩(wěn)穩(wěn)站在時代風(fēng)口浪尖,把脈前沿業(yè)態(tài)、引領(lǐng)發(fā)展潮流。”烏鎮(zhèn)大會的十年與百度AI的十年的時間線幾乎吻合,這十年百度一直在深耕AI并與時俱進(jìn)。
在今天的烏鎮(zhèn)峰會上,AI接棒互聯(lián)網(wǎng)成為下一個十年的數(shù)字經(jīng)濟(jì)之基石。隨著大模型技術(shù)的涌現(xiàn),AI產(chǎn)業(yè)“輕舟已過萬重山”。在全新的AI階段,百度早已做好了準(zhǔn)備,文心加飛槳,翩然赴星河。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。