科技云報到原創。
歷經兩年的持續進化,AI大模型進入產業落地階段。其中,泛娛樂作為大模型應用的重要領域,備受行業關注。大模型將重構這些領域的效率提升、體驗優化、模式創新等,已經成為業內的共識。
但AI大模型開發成本、精準度以及模型效率等是限制其落地的重要制約因素。大量的游戲、影視、AR/VR、3D生成等公司仍在探索,大模型應該以什么方式融入業務場景,才能帶來真正意義上的降本增效,以及全新的科技新體驗?
目前,這條落地路徑率先被百度智能云找到了。11月22日,百度智能云在業內首次發布了“空間智能解決方案”,從底層的AI基礎架構,到大模型應用開發層,再到上層的大模型AI應用,給予泛娛樂行業用戶全面的業務支撐。
這套方案不僅吸引了Unity、米哈游、上影集團等游戲影視巨頭前來合作,也吸引了哇嘶嗒(VAST)、智能AR眼鏡Rokid、生數科技等不少明星初創公司的深度共創,發布會現場更是擠滿了想要面對面交流的業內人。
在游戲、影視、3D生成等行業,百度智能云徹底破圈了。
何為空間智能
此次百度智能云的發布中,有一個概念備受關注:空間智能。
作為人工智能的下一個方向,空間智能既讓人充滿無限想象,也處于混沌之中。空間智能到底是什么,整個業界還未達成共識。
百度智能云泛科技業務部總經理張瑋認為,空間智能是步入智能進化征程的起點,能夠賦予AGI在多維空間中感知、理解、交互虛擬與現實互相映射的能力。
不僅如此,張瑋認為空間智能不局限于2D、3D,而是從2D到5D的全面智能化。
“2D和3D比較好理解,4D是在3D空間的基礎上加上了時間,空間智能可以隨著時間的變化,使空間的邏輯、物體的特征都隨之變化,5D是把空間里的物理感知,如:觸覺、嗅覺等,以及物理的反饋都加入進來了”,張瑋表示。
大模型的快速發展為空間智能應用落地打開了新的大門。
大模型特有的推理和生成能力,能夠很好地增強空間智能系統的環境感知能力,理解復雜的場景結構,如:室內布局、物體位置關系等,這對于實現精確的物體追蹤和場景重建至關重要。同時,大模型也可以用來生成高質量的3D模型、紋理、動畫等,從而豐富虛擬世界的細節。
結合空間智能,大模型還可以使虛擬角色或對象具備更高級別的交互能力。例如,通過訓練大模型來理解用戶的語音指令或手勢,虛擬助手可以在AR環境中提供個性化的服務;或者在VR游戲中,NPC可以根據玩家的行為做出更加自然的反應等。
簡單來說,現階段大模型的出現,使得空間智能實現的可能性大大增強。不僅提升了虛擬內容的創造性和互動性,也為用戶帶來了更加豐富和沉浸式的體驗。
正如張瑋所說,大模型對于2D到5D全面理解之后,將為用戶帶來更多的消費內容和原先不可能達到的交互體驗,并且基于這些新的交互體驗衍生出新的硬件,從而提供新的娛樂方式。
對于游戲、影視、動畫、AR/VR等泛娛樂行業來說,這無疑意味著全新的、廣闊的市場空間。
空間智能落地充滿挑戰
空間智能的前景固然激動人心,但對于具體的行業來說,它到底意味著什么,該如何落地,能做到什么程度,所有人都在摸著石頭過河。
哇嘶嗒(VAST)是一家致力于通用3D基礎模型研發的明星初創企業,它在2023年底面世的一款3D生成工具——Tripo,成為全球3D-AIGC領域最具競爭力的產品之一。今年3月,VAST和Stablity AI聯合推出的3D生成模型TripoSR,0.5秒就能通過單張圖片生成3D模型,一上線就引爆了全球的游戲開發者。
事實上,3D動畫、游戲、AR/VR蘊藏著千億級市場勢能,目前卻受限于生成效率和成本,但VAST這種大模型技術公司的出現,無疑大幅提升了游戲、動畫、影視等空間智能行業的創作效率,降低了內容制作的門檻,甚至可能創造出新一代的互聯網應用。
與之類似的大模型技術公司,還有生數科技。作為國內最早布局多模態通用大模型的團隊之一,今年4月,生數科技聯合清華大學發布了國內首款全面對標Sora的視頻大模型Vidu。市面上的主流AI視頻工具在生成4秒左右的視頻片段時,用戶通常需要等待1到5分鐘,而Vidu只需30秒。
這意味著在游戲制作、影視后期、動畫設計、內容社交等空間智能場景中,用戶可以在極短的時間內生成大量視頻素材,將大大降低生產成本、提升效率。
這些豐富的行業大模型應用,正在一步步完善空間智能的版圖。然而,技術和應用之間,始終隔著一道鴻溝,在技術向應用轉化時充滿荊棘。
首先,對于大模型技術本身來說,其生產效率還不夠高,成本沒有做到極致,對于人類意圖的理解也還不夠精準,轉化成行業應用時就存在大量的優化空間。
例如,在VAST對3D大規模模型的訓練過程中,就面臨著訓練周期冗長與成本高昂的雙重挑戰。
其次,游戲、影視等行業用戶對大模型技術不了解,在使用過程中難以真正發揮大模型優勢。同樣,IT技術人員對于行業也不了解,雙方需要長時間的去碰撞,才能打磨出適合行業的垂類大模型和相關應用。
事實上,技術和應用之間的鴻溝,誰能夠先越過去,誰就能先抵達成功的彼岸。
百度智能云推出“空間智能解決方案”
對于這道難題,百度智能云已率先上馬,迎難而上。
在百度智能云泛科技業務部總經理張瑋看來,空間智能相關場景在使用大模型技術時,往往會遇到幾大挑戰:
首先,空間智能企業在落地大模型時,從集群創建、開發實驗,到模型訓練、推理的全旅程算力需求,需要應對超大規模GPU集群高成本、難運營的問題。
因此,百度智能云在AI基礎架構層推出了【百度百舸AI異構計算平臺】,包括:中心云服務、邊緣云服務、實時互動RTC、AI數據服務等多種基礎服務,提供面向萬卡、十萬卡集群的算力管理能力。
一方面,百舸預置了主流的大模型訓練工具,能夠實現工具層面的秒級部署,并將萬卡集群運行準備時間從幾周縮減至1小時,極大地提升部署效率,縮短業務上線周期。
另一方面,百舸提供可觀測大盤,能夠對多芯適配、集群效能、任務自動容錯等方面進行全方位監測,提供直觀決策依據,幫助用戶更好地把控整體項目。
在萬卡任務上,百舸4.0可以保障有效訓練時長占比達到99.5%。針對目前國內芯片供應緊張的問題,為了保證企業供應鏈的安全和彈性,一云多芯是必然選擇,目前在萬卡規模上,百舸4.0將兩種芯片混合訓練下的效率折損控制在5%以內。同時,在跨地域的機房部署上,百舸4.0通過提供高效的拓撲結構、跨地域無擁塞高性能網絡和高效的模型并行訓練等方案,在橫跨幾十公里的多機房組成的萬卡規模的集群上,把單一訓練任務的性能折損控制在4%以內,保持業界領先。
目前,VAST、生數科技、Liblib、光魔科技等空間智能賽道的大模型公司,都選擇了百舸作為其底層的AI計算平臺。
例如,VAST基于百舸,解決了高性能計算、存儲網絡等基礎設施的使用和運維。同時,基于百舸的AI加速套件,使用了大模型訓練和推理場景的IO預處理優化、通信效率優化、顯存利用優化和模型算法優化等功能,極大提升了分布式訓練、推理的性能和效率。
再比如,光魔科技推出的AIGC創作平臺“白日夢”,需要依托各種視頻、圖片的剪輯能力以及大模型的生成效果。基于百舸,光魔科技搭建了整套邊緣算力節點,大幅降低了敏感算力的成本,并基于跨境專線CDN服務實現了海外加速。同時,基于百舸視頻云,光魔科技將多張生成的圖片,利用百度MCP產品的拼接能力,將無序的圖片變換成一個連環短片。在大模型應用上,基于百度千帆大模型平臺,實現了更加便利的生成劇本內容,以及對劇本內容進行理解并實現⼈設、分鏡等功能。
其次,空間智能的業務場景相當復雜,需要高效的大模型工具鏈去滿足復雜多樣的需求。
對此,百度智能云推出了【千帆大模型平臺】,它分為應用開發、模型服務、模型開發三層,為企業提供最易用的應用開發工具、最豐富的大模型和最全面的模型開發工具鏈,幫助企業將大模型深入到自己的生產力場景。
在應用開發層,針對空間智能落地大模型的高頻應用場景,提供企業級RAG、企業級Agent、一句話創建企業應用等關鍵能力,賦能企業高效開發企業級大模型應用。
在模型服務層,除了支持文心大模型外,也支持語音識別、物體檢測等傳統模型,企業可以根據場景,合理搭配大小模型,通過直接調用大幅提高自己的業務效率。
在模型開發層,千帆大模型平臺提供了完整的工具鏈,上線了DPO、KTO等模型訓練算法和PTQ等模型量化算法,能夠更高效地支持超大參數模型的微調和定制。不僅是大模型開發,升級后的千帆大模型平臺3.0還支持CV、NLP、語音等傳統模型的開發,并實現數據、模型、算力資源的統一納管和調度,為企業提供一站式的大、小模型開發體驗。
最后,不同的空間智能企業,在數據、場景和業務邏輯上呈現出行業差異,需要在通用大模型和行業大模型的能力基礎上,進一步增強行業能力,讓行業AI應用的開發事半功倍。
對此,百度智能云推出了完全適用于空間智能的AI應用及開發平臺。
例如,在空間內容創造方面,圍繞“人、場、物”多維互動打造空間智能新陣地。其中,空間智能Avatar能夠制作虛擬分身,空間智能平臺能夠生成虛擬空間場景,數字創作中心能夠實現多維數字的生成、分發、管理。
在空間智能交互方面,百度智能云提供從2D到5D的多維多模態實踐平臺,為打造全方位的空間構建提供了一站式的AI解決方案。
總的來說,百度智能云“空間智能解決方案”通過大模型+行業增強的能力,為空間智能的AI應用落地提供了真實的生產力——提高開發效率、降低開發門檻、實現快速創新,為空間智能領域多樣化的場景需求提供了強大的技術支撐。
百度智能云“破圈”
百度智能云為何在泛娛樂行業里破了圈?
尤其是空間智能是一個全新的領域,所有人都還在摸黑前行,百度智能云卻率先找到了一條切實可行的落地路徑,這是為什么?
顯然,這和百度一直以來對AI的追求息息相關。
憑借在人工智能領域長期的技術積累和高壓強式、馬拉松式研發投入,百度是國內最早推出AI大語言模型的企業,也是國內少有的能夠早早預判AI發展大趨勢的科技企業,這使得百度在AI領域總有“領先半步”的前瞻性。
過去2年,百度創始人李彥宏時不時因為“清醒發言”出圈,比如當國內還在聚焦百模大戰時,李彥宏就說“不要卷模型,要卷應用”。百度對于大模型落地以及AI原生應用的深刻理解,使其在技術、產品乃至組織上都是AI原生的,為行業落地AI做好了準備。
比如,在AI基礎設施上,百度智能云的算力、算法、數據是業界最全面的;在AI應用上,百度至今已推出100+AI原生應用,展示了其難以超越的AI產品開發能力。數據顯示,已有超過60%的央企和大量的民營企業,在聯合百度智能云進行AI創新,通過百度智能云千帆大模型平臺,累計精調了3.3萬個大模型,開發出了77萬個企業級應用。
實實在在的數據,展示了百度智能云在幫助各行各業落地AI、打破大模型技術障礙的超強執行力。這也就不難理解,為什么百度智能云能夠最先看到空間智能的市場潛力,找到和AI大模型結合的落地路徑,并且能夠快速地將相關的技術和解決方案推向市場。
不僅如此,面對空間智能這一新領域,百度智能云更是拿出了深耕的決心,愿意和行業客戶一起去探索落地——研究業務場景,理解業務需求,將需求轉化為技術進行落地,同時也愿意投入商業化資源去推廣行業應用,與客戶、生態伙伴一起將空間智能產業做大。
在百度智能云的商業生態版圖中,未來的空間智能將涵蓋游戲、電商、體育、智能設備、具身智能、教育、AI科技與影視動漫等多個行業,這將帶來千億級乃至萬億級別的產業規模。
隨著大模型技術的成熟,空間智能應用進一步落地,必然會為企業降本增效、打開新的可能性,帶來深遠影響。
這一過程顯然漫長而艱難,但對于百度智能云這樣的“長期主義者”來說,這本身就是一種修行,能夠沉下心去面對一切市場的喧囂,撇去技術的泡沫。
正如百度智能云泛科技業務部總經理張瑋所說,空間智能從概念到落地具體應用還有很長的路要走,希望能把產業聯盟做得更完善,有更多的生態廠商一起來探索落地,“落地到有邊界的場景、可以服務的客戶、具象化的行業產品和功能,逐步去滿足空間智能大部分的需求”。
或許在某個時刻,空間智能產業會臨近奇點、迎來爆發,但技術帶來的產業革命總是靜默而深刻。當我們在未來回頭望去,才會意識到,這場變革早已開始。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。