就在昨日,我國人工智能大模型領域又迎來重大突破,AGI的真正連鎖反應或將從視頻開始。
4月27日上午,“2024中關村論壇-未來人工智能先鋒論壇”在北京正式舉辦,本次平行論壇由科學技術部、北京市人民政府主辦,旨在進一步探討“語言大模型”、“多模態大模型”、“具身智能”等新一代人工智能關鍵技術與應用的創新。
國產AI視頻斬獲新進展,中國版“Sora”閃亮登場
就在此次論壇會議上,國內首個純自研Sora級視頻大模型Vidu正式發布。該模型由北京生數科技聯合清華大學共同研發,是我國首個長時長、高一致性、高動態性視頻大模型。Vidu的發布,表明我國在視頻大模型領域已初步具備對標Sora的能力,標志著我國全面進入視頻大模型自研時代。
據介紹,Vidu采用研發團隊原創的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容,不僅能模擬真實物理世界,還擁有豐富想象力,具備多鏡頭生成、時空一致性高等特點。
值得注意的是,與Sora相比,Vidu可以生成特有的中國元素,例如熊貓、龍等。
不少業內人士認為,盡管目前Vidu生成視頻的能力只有16秒,距離Sora宣稱的還有一定差距,但這顯然是訓練量不足導致的,Vidu現在的成果表明技術方向是正確的。僅從視頻效果和發布時間來看,Vidu已超出了大部人的預期,未來隨著在算力、時長等方向上的延伸和突破,Vidu有望為我們帶來更多驚喜。
文生視頻時代悄然降臨,部分行業或將加速變革
此前的2月16日,OpenAI的文字生成視頻模型--Sora首次面世。該模型可以根據所輸入的prompt(提示詞),直接輸出最高長達60秒的視頻,并且包含高度細致的背景、復雜的多角度鏡頭,以及富有情感的多個角色。
當時Sora發布的生成視頻,無論從人物動作還是場景表現上看,都無比貼近現實。如果不告訴觀看者視頻是由AI生成的,誰又能辨別出來呢?
這個能夠快速且優質地將文字描述轉化為引人入勝視頻的AI工具,不僅僅代表著技術上的一次巨大飛躍,也預示著我們熟悉的許多行業即將面臨一場革命。
有關統計數據顯示,目前,全球有超過60億人口是視頻工具和短視頻的用戶,而其中與視頻產業相關的從業者可能已經超過了將近10億人,占到了全球總人口的13%到14%,這些從業者涵蓋了影視行業、短視頻行業等諸多我們日常觸手可及的各種視頻展示領域。
對于影視行業來說,AI視頻模型的出現,將極大地降低拍攝劇集的門檻。
做了20年影視導演的某位業內人士,看到AI視頻后說的第一句話是“要變天了”,第二句話是“我直到今天才慶幸自己是個導演”。
令從業者發此感嘆,主要是因為現在的影視行業,分工極其精細,很多工種和里面的從業者都是階段式配合,可以說一個環節掉鏈子,整個戲就可能功虧一簣。而如果AI視頻按照現在的速度發展下去,未來至少很多簡單的鏡頭、群演、燈光布景等,都可以用AI去完成了。
而對于短視頻行業來說,AI視頻生成模型的陸續發布,無疑將令行業競爭進一步加劇。
在全球范圍內,無論是中國的抖音、快手、B站和小紅書等平臺,還是國際版的TikTok,短視頻內容消費正處于前所未有的高峰。而隨著AI模型的出現,用戶現在能夠迅速制作出各種類型的視頻內容,未來稀缺的不再將是視頻拍攝或者剪輯的能力,只要擁有獨特的創意,便可輕松入局,行業本就激烈的競爭可能進一步加劇。
文生視頻熱潮之下,國內哪些上市公司已布局?
文生視頻作為AI領域的新興熱點概念,此前曾受到市場資金的“追捧”。2月19日,在Sora的催化之下,諸多概念股迅速升溫,部分公司當日股價呈現“20cm漲停”。
而本次Vidu視頻生成模型的隆重推出,是否會進一步帶動相關概念股股價上漲呢?讓我們拭目以待,周一開盤見分曉。
據覽富財經網不完全統計,目前A股市場中涉及文生視頻相關概念的,共有12家公司,其中不少公司都在積極推進相關業務。

文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。