国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

蔚來(lái)智駕芯片神璣NX9031開(kāi)啟“賺錢”模式 已向一公司提供技術(shù)授權(quán)東風(fēng)汽車布局低空技術(shù),首臺(tái)馬赫動(dòng)力2.0T飛行發(fā)動(dòng)機(jī)交付華為“碰一碰”新專利公布:重塑內(nèi)容分享模式 引領(lǐng)設(shè)備交互新范式級(jí)數(shù)AI與阿里云達(dá)成全棧AI戰(zhàn)略合作奇瑞風(fēng)云 T9L 官宣 2025 廣州車展首發(fā)亮相諾基亞公布全新戰(zhàn)略:聚焦 AI 驅(qū)動(dòng)的網(wǎng)絡(luò)變革,整合為兩大核心業(yè)務(wù)板塊夸克 AI 眼鏡與支付寶合作升級(jí),新增骨傳導(dǎo)拾音、準(zhǔn)心等獨(dú)家能力東軟云科技入選福布斯中國(guó)“2025出海全球化領(lǐng)軍品牌TOP30”11月24日榮耀500系列發(fā)布 來(lái)京東1元鎖定“龍馬金繩”真金禮盒同款iPad Air京東比Apple官方便宜上千元 全國(guó)可用的政府補(bǔ)貼真香縱橫G700迪拜上市:中國(guó)豪華越野的全球奢享宣言華為Mate X7今日開(kāi)啟預(yù)訂 搭載第二代紅楓影像等配置百度Q3 AI收入96億元同比增50%,蘿卜快跑出行量翻倍榮耀500全系搭載驍龍8系旗艦芯華為MatePad Edge首次實(shí)現(xiàn)平板、電腦深度融合:四指橫滑無(wú)縫切換千問(wèn)登場(chǎng),阿里瞄準(zhǔn)C端關(guān)鍵一戰(zhàn)“雙十一”履約時(shí)效“卷”至分鐘級(jí),順豐同城全場(chǎng)景全渠道單量顯著增長(zhǎng)工信部:到2027年,建成200個(gè)左右高標(biāo)準(zhǔn)數(shù)字園區(qū)飛利浦Evnia弈威推27M2N6501L顯示器:27" QHD 240Hz QD-OLEDQuestMobile2025年雙十一洞察報(bào)告:平臺(tái)間用戶爭(zhēng)奪戰(zhàn)激烈
  • 首頁(yè) > 云計(jì)算頻道 > 大模型

    通義萬(wàn)相首創(chuàng)生成漢字視頻,全面進(jìn)化稱霸VBench!AI視頻GPT-3時(shí)刻來(lái)臨

    2025年01月10日 14:15:22 來(lái)源:新智元公眾號(hào)

      通義萬(wàn)相視頻模型,再度迎來(lái)史詩(shī)級(jí)升級(jí)!處理復(fù)雜運(yùn)動(dòng)、還原真實(shí)物理規(guī)律等方面令人驚嘆,甚至業(yè)界首創(chuàng)了漢字視頻生成,F(xiàn)在,通義萬(wàn)相直接以84.70%總分擊敗了一眾頂尖模型,登頂VBench榜首。

      Sora、Veo2接連發(fā)布之后,AI視頻生成的戰(zhàn)場(chǎng)又熱鬧了起來(lái)。

      就在昨天,通義萬(wàn)相視頻生成模型迎來(lái)了重磅升級(jí)!

      他們一口氣推出了兩個(gè)版本:注重高效的2.1極速版、追求卓越表現(xiàn)的2.1專業(yè)版。

      剛一上線,就異常火爆,等待時(shí)間甚至一度達(dá)到了1小時(shí)

      此次,全面升級(jí)的模型不僅在架構(gòu)上取得創(chuàng)新,更是以84.70%總分登頂權(quán)威評(píng)測(cè)榜單VBench榜首。

      通義萬(wàn)相2.1的性能一舉超越了Gen-3、CausVid等全球頂尖模型。

      在實(shí)用性方面,通義萬(wàn)相2.1也得到了顯著的提升,尤其是在處理復(fù)雜運(yùn)動(dòng)、還原真實(shí)物理規(guī)律、提升影視質(zhì)感、優(yōu)化指令遵循等方面。

      以下都是我們實(shí)測(cè)出的Demos,就說(shuō)夠不夠拍電影大片吧!

      更令人驚嘆的是,它還在業(yè)界首次實(shí)現(xiàn)了中文文字視頻生成,讓AI視頻文字創(chuàng)作再無(wú)門檻。

      以紅色新年宣紙為背景,出現(xiàn)一滴水墨,暈染墨汁緩緩暈染開(kāi)來(lái)。文字的筆畫邊緣模糊且自然,隨著暈染的進(jìn)行,水墨在紙上呈現(xiàn)「!棺郑珡纳畹綔\過(guò)渡,呈現(xiàn)出獨(dú)特的東方韻味。背景高級(jí)簡(jiǎn)潔,雜志攝影感。

      從今天起,所有人皆可在通義萬(wàn)相官網(wǎng)體驗(yàn)新模型,開(kāi)發(fā)者則可以通過(guò)阿里云百煉直接調(diào)用API,阿里云也成為了國(guó)內(nèi)第一家實(shí)現(xiàn)視頻生成模型商業(yè)化的云廠商。

      那么,通義萬(wàn)相2.1究竟給我們帶來(lái)了哪些驚喜?

      我們經(jīng)過(guò)一番實(shí)測(cè)后,總結(jié)出了5大要點(diǎn)。

      1. 首創(chuàng)中文文字生成

      通常來(lái)說(shuō),文字生成是AI視頻模型進(jìn)化的一大痛點(diǎn)。

      我們已經(jīng)看到Sora、Gen-3等模型,已經(jīng)能夠生成很好的英文字母效果,不過(guò)截至目前,從未有一個(gè)模型能攻克漢字的生成難題。

      為什么之前的AI視頻生成工具,都在「逃避」中文文字生成這個(gè)難題?

      這是因?yàn)殡y點(diǎn)在于,中文文字的字體結(jié)構(gòu)比英文更復(fù)雜,而且需要考慮筆畫的層次感。在布局方面,中文字體更講究,做成動(dòng)態(tài)效果時(shí)對(duì)美感要求更高。

      而阿里通義萬(wàn)相,便是首個(gè)中文文字視頻生成的模型。從此,AI視頻生成邁入「中文時(shí)代」!

      這一切,只需要你動(dòng)動(dòng)手指,輸入簡(jiǎn)單的文字提示就夠了。

      天空中飄著云朵,云朵呈現(xiàn)「新年快樂(lè)」的字樣,微風(fēng)吹過(guò),云朵隨著風(fēng)輕輕飄動(dòng)。

      水彩透疊插畫風(fēng)格,兩只不同顏色的可愛(ài)小貓咪手舉著一條超大的魚(yú),從右邊走到左邊。它們分別穿著粉色和藍(lán)色的小背心,眼睛圓圓的,表情呆萌。充滿童趣,筆觸淡雅溫馨,簡(jiǎn)筆畫風(fēng)格。純白背景上逐漸顯示出來(lái)幾個(gè)字體,寫著:「摸魚(yú)一天 快樂(lè)無(wú)邊」。

      一只柯基坐在桌前冥想,背后一個(gè)「靜」字非常應(yīng)景。

      一只柯基面前擺放著一只小巧的木魚(yú),仿佛在進(jìn)行冥想儀式,背景出現(xiàn)字樣「靜」。

      2. 更穩(wěn)定的復(fù)雜運(yùn)動(dòng)生成

      對(duì)于大多數(shù)AI視頻模型來(lái)說(shuō),無(wú)法逃脫「體操」魔咒。有人稱,這是AI視頻最新的「圖靈測(cè)試」。

      你會(huì)經(jīng)常看到,AI體操視頻生成中,扭曲的肢體、不協(xié)調(diào)的動(dòng)作滿屏皆是。

      這僅是復(fù)雜肢體運(yùn)動(dòng)的一種,因?yàn)樯婕暗骄?xì)細(xì)節(jié)和高水平動(dòng)作協(xié)調(diào),成為了AI視頻生成的一項(xiàng)重要評(píng)判標(biāo)準(zhǔn)。

      生成一個(gè)人物復(fù)雜運(yùn)動(dòng),對(duì)于AI來(lái)說(shuō)就像是在解一道物理難題——

      它不僅要做到身體各個(gè)部位精準(zhǔn)配合,讓四肢保持協(xié)調(diào),還要考慮重力、人體運(yùn)動(dòng)特點(diǎn)、平衡感等各種細(xì)節(jié)。

      在最新升級(jí)中,通義萬(wàn)相在多種場(chǎng)景下展示了驚人的「運(yùn)動(dòng)天賦」。

      滑冰、游泳、跳水這些極易出錯(cuò)的名場(chǎng)面,萬(wàn)相2.1也通通Hold住,沒(méi)有出現(xiàn)任何詭異的肢體動(dòng)作,和不符合物理規(guī)律的場(chǎng)景。

      平拍一位女性花樣滑冰運(yùn)動(dòng)員在冰場(chǎng)上進(jìn)行表演的全景。她穿著紫色的滑冰服,腳踩白色的滑冰鞋,正在進(jìn)行一個(gè)旋轉(zhuǎn)動(dòng)作。她的手臂張開(kāi),身體向后傾斜,展現(xiàn)了她的技巧和優(yōu)雅。

      在泳池中,一名男子正在奮力向前游動(dòng)。近景俯拍鏡頭下,他穿著黑色泳衣,戴著白色泳帽和黑色泳鏡,正在水中劃動(dòng)雙臂。他的頭部部分被泳帽和泳鏡遮擋,只露出嘴巴和鼻子。他的手臂在水中劃動(dòng),產(chǎn)生了一系列的水花和氣泡。隨著他的動(dòng)作,水面上出現(xiàn)了漣漪,水花四濺。背景是藍(lán)色的泳池。

      就看這個(gè)跳水動(dòng)作,完全就是一個(gè)專業(yè)級(jí)選手的樣子。肌肉的精準(zhǔn)控制、濺起的水花,都非常符合自然規(guī)律。

      一名男子在跳臺(tái)上做專業(yè)跳水動(dòng)作。全景平拍鏡頭中,他穿著紅色泳褲,身體呈倒立狀態(tài),雙臂伸展,雙腿并攏。鏡頭下移,他跳入水中,濺起水花。背景中是藍(lán)色的泳池。

      特寫鏡頭下,女孩以手指輕觸紅唇,然后開(kāi)懷大笑。這么近的懟臉特寫,表情肌的走向和分布都十分自然,臉部紋路和嘴角笑起的弧線,也逼真似真人。

      特寫鏡頭下,一位美女面容精致,她先是以手指輕觸紅唇,微微抿嘴,眼神中透露出一絲俏皮。緊接著,她毫無(wú)保留地開(kāi)懷大笑,笑容如同綻放的花朵,美麗動(dòng)人,眼角彎成了月牙狀,展現(xiàn)出無(wú)比的快樂(lè)與感染力。

      3. 更靈活的運(yùn)鏡控制

      同一個(gè)場(chǎng)景下的視頻,為什么專業(yè)人士拍出來(lái)就是不一樣?某種程度上講,秘訣在于「運(yùn)鏡」。

      那么,對(duì)于AI來(lái)說(shuō),教它運(yùn)鏡就相當(dāng)于在教機(jī)器人當(dāng)導(dǎo)演。

      它需要理解跟隨拍攝節(jié)奏、快慢推進(jìn)速度,還要保持協(xié)調(diào)性的問(wèn)題,比如鏡頭移動(dòng)時(shí),主體不能丟失;運(yùn)鏡速度變化要自然,不能忽快忽慢。

      更重要的是,AI還得有藝術(shù)感,運(yùn)鏡效果要符合視覺(jué)習(xí)慣,動(dòng)態(tài)美感要恰到好處。

      在通義萬(wàn)相2.1版本中,AI展現(xiàn)出了專業(yè)級(jí)的運(yùn)鏡效果。

      穿著禪衣的小狐貍,在360度運(yùn)鏡下歡快跳舞,這不,夢(mèng)幻般的效果一下子就來(lái)了。

      穿著禪意風(fēng)服飾的可愛(ài)狐貍在林間空地上歡快地跳舞,身上的衣物隨風(fēng)輕揚(yáng)。狐貍有著蓬松的尾巴和靈動(dòng)的眼神,嘴角帶著微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,陽(yáng)光透過(guò)竹葉灑下斑駁光影。畫面采用旋轉(zhuǎn)拍攝,營(yíng)造出夢(mèng)幻般的動(dòng)感效果。整體風(fēng)格清新自然,充滿東方韻味。近景動(dòng)態(tài)特寫。

      此外,新模型還能自動(dòng)根據(jù)場(chǎng)景需求,智能調(diào)整運(yùn)鏡速度,完美把控了鏡頭的節(jié)奏。

      海王在暴風(fēng)雨中駕馭巨浪前行,這種級(jí)別的運(yùn)鏡絕對(duì)經(jīng)得起考驗(yàn),出現(xiàn)在大熒幕上也毫不違和。

      暴風(fēng)雨中的海面,海王駕馭巨浪前行,肌肉線條,灰暗天空,戲劇性照明,動(dòng)態(tài)鏡頭,粗獷,高清,動(dòng)漫風(fēng)格

      實(shí)驗(yàn)室中女醫(yī)生精心設(shè)計(jì)的特寫鏡頭,細(xì)膩的表情刻畫,以及背后燈光、實(shí)驗(yàn)器材等多種元素碰撞,讓整個(gè)角色立即具備了豐富的層次感。

      富有電影感的鏡頭捕捉了一位身著暗黃色生化防護(hù)服的女醫(yī)生,實(shí)驗(yàn)室慘白的熒光燈將她的身影籠罩其中。鏡頭緩緩?fù)七M(jìn)她的面部特寫,細(xì)膩的橫向推移凸顯出她眉宇間深深刻畫的憂思與焦慮。她專注地俯身于實(shí)驗(yàn)臺(tái)前,目不轉(zhuǎn)睛地透過(guò)顯微鏡觀察,手套包裹的雙手正謹(jǐn)慎地微調(diào)著焦距。整個(gè)場(chǎng)景籠罩在壓抑的色調(diào)之中,防護(hù)服呈現(xiàn)出令人不安的黃色,與實(shí)驗(yàn)室冰冷的不銹鋼器械相互映襯,無(wú)聲地訴說(shuō)著事態(tài)的嚴(yán)峻和未知的威脅。景深精確控制下,鏡頭對(duì)準(zhǔn)她眼中流露的恐懼,完美傳達(dá)出她肩負(fù)的重大壓力與責(zé)任。

      下面這個(gè)鏡頭中,穿過(guò)一條兩盤種滿樹(shù)木的郊區(qū)住宅街道,給人一種實(shí)時(shí)拍攝的感覺(jué)。

      A fast-tracking shot down an suburban residential street lined with trees. Daytime with a clear blue sky. Saturated colors, high contrast

      4. 真實(shí)的物理規(guī)律模擬

      AI視頻模型不理解物理世界,一直以來(lái)飽受詬病。

      比如,Sora不僅會(huì)生成8條腿的螞蟻,而且眼瞧著手都要被切斷了,也切不開(kāi)西紅柿, 而通義萬(wàn)相2.1切西紅柿就像發(fā)生在現(xiàn)實(shí)生活中一樣自然真實(shí)。

      這一次,通義萬(wàn)相在物理規(guī)律理解上,得到顯著提升。通過(guò)對(duì)現(xiàn)實(shí)世界動(dòng)態(tài)和細(xì)節(jié)深入認(rèn)知,就能模擬出真實(shí)感十足的視頻,避免「一眼假」情況的出現(xiàn)。

      就看這個(gè)經(jīng)典切牛排的視頻,刀刃沿著肉質(zhì)紋理緩緩切入,表面上一層薄薄的油脂,在陽(yáng)光下散發(fā)著誘人的光澤,每一處細(xì)節(jié)都盡顯質(zhì)感與鮮美。

      在餐廳里,一個(gè)人正在切一塊熱氣騰騰的牛排。在特寫俯拍下,這個(gè)人右手拿著一把鋒利的刀,將刀放在牛排上,然后沿著牛排中心切開(kāi)。這個(gè)人手上涂著白色指甲油,背景是虛化的,有一個(gè)白色的盤子,里面放著黃色的食物,還有一張棕色的桌子。

      它具備更強(qiáng)大的概念組合能力,能夠準(zhǔn)確理解和整合元素級(jí)的概念,使其在生成內(nèi)容時(shí)更加智能。

      比如,柯基+拳擊,會(huì)碰撞出什么呢?

      AI生成的柯基打斗的畫面,真給人一種人類拳擊的現(xiàn)場(chǎng)感。

      兩只柯基狗在擂臺(tái)中央進(jìn)行拳擊比賽。左邊的狗戴著黑色拳套,右邊的狗戴著紅色拳套。平拍鏡頭下,兩只狗都穿著拳擊短褲,身體肌肉線條明顯。它們互相揮動(dòng)拳頭,進(jìn)行攻防轉(zhuǎn)換。整個(gè)場(chǎng)景在固定視角下拍攝,沒(méi)有明顯的運(yùn)鏡變化。

      AI大牛Karpathy最愛(ài)考驗(yàn)AI視頻的難題,就是「水獺在飛機(jī)上用wifi」。這道題,萬(wàn)相2.1完美做出。

      5. 高級(jí)質(zhì)感、多種風(fēng)格、多長(zhǎng)寬比

      更值得一提的是,萬(wàn)相2.1能夠生成「電影級(jí)」畫質(zhì)的視頻。

      同時(shí),它還能支持各類藝術(shù)風(fēng)格,比如卡通、電影色、3D風(fēng)格、油畫、古典等等。

      不論是哥特式電影風(fēng)格,還是中國(guó)古典宮廷風(fēng)格,AI將其特點(diǎn)呈現(xiàn)得淋漓盡致。

      哥特式電影風(fēng)格,亞當(dāng)斯騎在一匹黑色駿馬上,馬蹄輕踏在古老的石板路上。她身穿黑色長(zhǎng)裙,頭戴寬邊帽,眼神冷峻,嘴角微揚(yáng),透出一絲神秘。背景是陰暗的古堡和茂密的森林,天空中飄著烏云。鏡頭晃動(dòng),營(yíng)造出一種不安與緊張的氛圍。近景動(dòng)態(tài)騎馬場(chǎng)景。

      這個(gè)中國(guó)古典宮廷風(fēng)格的畫面,鏡頭由群臣向前推進(jìn),聚焦在身披龍袍的皇帝身上,好像正在上映的一部古裝劇。

      中國(guó)古典宮廷風(fēng)格,古代皇宮宮殿上正在進(jìn)行皇帝的登基大典。群臣身著華麗朝服,表情肅穆,排列整齊。鏡頭從群臣視角出發(fā)快速向前推進(jìn),鎖定在身穿龍袍、頭戴皇冠的皇帝身影上;实勖嫒萃䥽(yán),眼神堅(jiān)定,緩緩步入大殿。背景是金碧輝煌的大殿,雕梁畫棟,氣勢(shì)恢宏。畫面帶有濃厚的皇家氛圍,近景特寫與中景結(jié)合,快速推進(jìn)和跟隨拍攝。

      養(yǎng)蜂人手中的蜂蜜罐在陽(yáng)光中折射出溫暖的光暈,背后的向日葵與鄉(xiāng)村老宅相映成趣,構(gòu)筑出一幅充滿歲月與質(zhì)感的畫面。

      The camera floats gently through rows of pastel-painted wooden beehives, buzzing honeybees gliding in and out of frame. The motion settles on the refined farmer standing at the center, his pristine white beekeeping suit gleaming in the golden afternoon light. He lifts a jar of honey, tilting it slightly to catch the light. Behind him, tall sunflowers sway rhythmically in the breeze, their petals glowing in the warm sunlight. The camera tilts upward to reveal a retro farmhouse.

      大文豪李白的「舉頭望明月,低頭思故鄉(xiāng)」,AI直接把氛圍感拉滿。

      古風(fēng)畫面,一位古人抬頭望著月亮,緩緩低頭,眼神中流露出深深的思鄉(xiāng)之情。

      對(duì)于詞窮的創(chuàng)意者來(lái)說(shuō),通義萬(wàn)相「智能體擴(kuò)寫」功能非常友好。比如, 我想生成一個(gè)「超快放大蒲公英,展現(xiàn)宏觀夢(mèng)幻般的抽象世界」。

      若想要細(xì)節(jié)更豐富的描述,直接交給AI就好了。它會(huì)自動(dòng)生成一段文案,可以直接復(fù)用,也可以二次編輯修改。

      且看,AI視頻中展現(xiàn)了蒲公英種子的驚人細(xì)節(jié),鏡頭慢慢放大至每根絨毛纖毫畢現(xiàn),仿佛進(jìn)入了一個(gè)夢(mèng)幻般的世界。

      此外,萬(wàn)相2.1還能支持5種不同的長(zhǎng)寬比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配電視、電腦、手機(jī)等不同終端設(shè)備。

      核心架構(gòu)創(chuàng)新

      那么,到底是什么讓通義萬(wàn)相,能在激烈AI視頻生成競(jìng)爭(zhēng)中脫穎而出?

      它又藏著哪些讓人眼前一亮的「黑科技」?

      接下來(lái),讓我們逐一分解此次2.1版本的技術(shù)創(chuàng)新突破點(diǎn)。

      自研VAE與DiT雙重突破

      通過(guò)采用自研的高效VAE和DiT架構(gòu),阿里團(tuán)隊(duì)在時(shí)空上下文關(guān)系建模方面取得重大突破。

      模型基于線性噪聲軌跡的Flow Matching方案展開(kāi)了深度設(shè)計(jì),同時(shí)驗(yàn)證了Scaling Law在視頻生成任務(wù)中的有效性。

      通義萬(wàn)相2.1視頻生成架構(gòu)圖

      在視頻VAE層面,通過(guò)結(jié)合緩存機(jī)制和因果卷積,團(tuán)隊(duì)提出了一個(gè)極具創(chuàng)新性的視頻編碼解決方案。

      通過(guò)將視頻拆分為多個(gè)若干塊(Chunk)并緩存中間特征,替代長(zhǎng)視頻的E2E編端到端解碼過(guò)程。顯存的使用僅與Chunk大小相關(guān),與原始視頻長(zhǎng)度無(wú)關(guān)。

      由此,這一關(guān)鍵技術(shù)能夠支持無(wú)限長(zhǎng)1080P視頻的高效編解碼,為任意時(shí)長(zhǎng)視頻訓(xùn)練開(kāi)辟新途徑。

      如下圖所示,展示了不同VAE模型的計(jì)算效率和視頻壓縮重構(gòu)指標(biāo)的結(jié)果。

      值得一提的是,通義萬(wàn)相VAE在較小的模型參數(shù)規(guī)模下,取得了業(yè)內(nèi)領(lǐng)先的視頻壓縮重構(gòu)質(zhì)量。

      通義萬(wàn)相2.1視頻VAE和其他方法的結(jié)果對(duì)比

      DiT架構(gòu)的設(shè)計(jì)圍繞兩個(gè)核心目標(biāo)展開(kāi):實(shí)現(xiàn)強(qiáng)大的時(shí)空建模能力,同時(shí)保持高效的訓(xùn)練過(guò)程。

      具體創(chuàng)新包括:

      · 時(shí)空全注意機(jī)制

      為了提高時(shí)空關(guān)系建模能力,通義萬(wàn)相團(tuán)隊(duì)采用了「時(shí)空全注意機(jī)制」,讓模型能夠更準(zhǔn)確地模擬現(xiàn)實(shí)世界的復(fù)雜動(dòng)態(tài)。

      · 參數(shù)共享機(jī)制

      團(tuán)隊(duì)引入了「參數(shù)共享機(jī)制」,不僅提升了模型性能,還有效降低了訓(xùn)練成本。

      · 優(yōu)化文本嵌入

      針對(duì)文本嵌入進(jìn)行了性能優(yōu)化,在提供更優(yōu)的文本可控性的同時(shí),還降低了計(jì)算需求。

      得益于這些創(chuàng)新,使得新模型在相同計(jì)算成本下,凸顯出收斂的優(yōu)越性,并更易實(shí)現(xiàn)Scaling Law的驗(yàn)證。

      超長(zhǎng)序列訓(xùn)練和推理

      通過(guò)結(jié)合全新通義萬(wàn)相模型 Workload 的特點(diǎn)和訓(xùn)練集群的硬件性能,團(tuán)隊(duì)制定了訓(xùn)練的分布式、顯存優(yōu)化的策略。

      這一策略在保證模型迭代時(shí)間前提下,優(yōu)化訓(xùn)練性能,在業(yè)界率先實(shí)現(xiàn)了100萬(wàn)Tokens的高效訓(xùn)練。

      在分布式訓(xùn)練策略上,團(tuán)隊(duì)開(kāi)發(fā)了創(chuàng)新的4D并行策略,結(jié)合了DP、FSDP、RingAttention、Ulysses混合并行,顯著提升了訓(xùn)練性能和分布式擴(kuò)展性。

      通義萬(wàn)相4D并行分布式訓(xùn)練策略

      在顯存優(yōu)化上,采用了分層顯存優(yōu)化策略優(yōu)化Activation顯存,解決了顯存碎片問(wèn)題。

      在計(jì)算優(yōu)化上,使用FlashAttention3進(jìn)行時(shí)空全注意力計(jì)算,并結(jié)合訓(xùn)練集群在不同尺寸上的計(jì)算性能,選擇合適的CP策略進(jìn)行切分。

      同時(shí),針對(duì)一些關(guān)鍵模塊,去除計(jì)算冗余,使用高效Kernel實(shí)現(xiàn),降低訪存開(kāi)銷,提升了計(jì)算效率。

      在文件系統(tǒng)優(yōu)化上,結(jié)合了阿里云訓(xùn)練集群的高性能文件系統(tǒng),采用分片Save/Load方式,提升了讀寫性能。

      在模型訓(xùn)練過(guò)程中,通過(guò)錯(cuò)峰內(nèi)存使用方案,能夠解決多種OOM問(wèn)題,比如由Dataloader Prefetch 、CPU Offloading 和 Save Checkpoint所引起的問(wèn)題。

      在訓(xùn)練穩(wěn)定性方面,借助于阿里云訓(xùn)練集群的智能化調(diào)度、慢機(jī)檢測(cè),以及自愈能力,能在訓(xùn)練過(guò)程中實(shí)現(xiàn)自動(dòng)識(shí)別故障節(jié)點(diǎn)并快速重啟任務(wù)。

      規(guī);瘮(shù)據(jù)構(gòu)建管線與模型自動(dòng)化評(píng)估機(jī)制

      規(guī);母哔|(zhì)量數(shù)據(jù)是大型模型訓(xùn)練的基礎(chǔ),而有效的模型評(píng)估,則指引著大模型訓(xùn)練的方向。

      為此,團(tuán)隊(duì)建立了一套完整的自動(dòng)化數(shù)據(jù)構(gòu)建系統(tǒng)。

      該管線在視覺(jué)質(zhì)量、運(yùn)動(dòng)質(zhì)量等方面與人類偏好分布高度一致,能夠自動(dòng)構(gòu)建高質(zhì)量的視頻數(shù)據(jù),同時(shí)還具備多樣化、分布均衡等特點(diǎn)。

      針對(duì)模型評(píng)估,團(tuán)隊(duì)還開(kāi)發(fā)了覆蓋多維的自動(dòng)化評(píng)估系統(tǒng),涵蓋美學(xué)評(píng)分、運(yùn)動(dòng)分析和指令遵循等20多個(gè)維度。

      與此同時(shí),訓(xùn)練出專業(yè)的打分器,以對(duì)齊人類偏好,通過(guò)評(píng)估反饋加速模型的迭代優(yōu)化。

      AI視頻生成下一個(gè)里程碑

      去年12月,OpenAI和谷歌相繼放出Sora、Veo2模型,讓視頻生成領(lǐng)域的熱度再一次升溫。

      從創(chuàng)業(yè)新秀到科技巨頭,都希望在這場(chǎng)技術(shù)革新中尋找自己的位置。

      但是相較于文本的生成,制作出令人信服的AI視頻,確實(shí)是一個(gè)更具挑戰(zhàn)性的命題。

      Sora正式上線那天,奧特曼曾表示,「它就像視頻領(lǐng)域的GPT-1,現(xiàn)在還處于初期階段」。

      若要從GPT-1通往GPT-3時(shí)刻,還需要在角色一致性、物理規(guī)律理解、文本指令精準(zhǔn)控制等方面取得技術(shù)突破。

      當(dāng)AI真正打破現(xiàn)實(shí)創(chuàng)作的局限,賦予創(chuàng)意工作者前所未有的想象,新一輪的行業(yè)變革必將隨之而來(lái)。

      此次,通義萬(wàn)相2.1取得重大突破,讓我們有理由相信,AI視頻的GPT-3時(shí)刻正加速到來(lái)。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    海報(bào)生成中...

    最新新聞

    熱門新聞

    即時(shí)

    全球頂級(jí)AI創(chuàng)作社區(qū)回歸!海藝AI國(guó)內(nèi)首發(fā)“全民娛樂(lè)化創(chuàng)作

    海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場(chǎng)占比高達(dá)35.8%,阿里云引領(lǐng)中國(guó)AI云增長(zhǎng)

    9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃,助力中小企

    9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動(dòng)圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    国产美女视频91| 欧美成人bangbros| 91在线精品秘密一区二区| 欧美日韩一区二区三区视频| 国产欧美一区二区三区在线看蜜臀| 亚洲精品国产无套在线观| 久久精品国产亚洲5555| 欧美影院一区二区| 欧美国产精品一区二区三区| 免费在线看成人av| 欧美视频一区二区三区四区 | 婷婷成人综合网| 99在线精品免费| 久久精品一区四区| 久久国产综合精品| 欧美一区二区免费| 婷婷国产在线综合| 欧美色综合网站| 一区二区三区波多野结衣在线观看| 国产乱淫av一区二区三区| 欧美一区二区三区四区视频 | 欧美一区二区视频在线观看2022 | 蓝色福利精品导航| 欧美顶级少妇做爰| 午夜免费欧美电影| 在线播放中文一区| 日韩va亚洲va欧美va久久| 欧美色男人天堂| 亚洲午夜在线视频| 欧美人xxxx| 日韩成人精品视频| 日韩视频国产视频| 国内久久婷婷综合| 国产日韩v精品一区二区| 国产成人高清在线| 成人免费一区二区三区视频| 99re8在线精品视频免费播放| 欧美激情综合网| 成人av免费在线播放| 中文字幕视频一区| 91国内精品野花午夜精品| 亚洲综合在线观看视频| 欧美色图第一页| 日日噜噜夜夜狠狠视频欧美人| 91.成人天堂一区| 精品一区二区在线看| 久久精品日产第一区二区三区高清版| 欧美tk丨vk视频| 久久精品久久99精品久久| 精品国产髙清在线看国产毛片| 精品一区二区三区免费毛片爱| 欧美zozozo| 国产精品1区2区| 亚洲欧美视频在线观看视频| 欧美日本免费一区二区三区| 九九热在线视频观看这里只有精品| 久久九九99视频| 色综合天天综合狠狠| 亚洲a一区二区| 国产亚洲欧美中文| 91国偷自产一区二区开放时间 | 国产福利不卡视频| 亚洲免费观看高清完整版在线观看| 欧亚一区二区三区| 九九久久精品视频| 亚洲乱码国产乱码精品精可以看 | 久久精品国产亚洲aⅴ| 国产精品污www在线观看| 欧美四级电影网| 国产91在线看| 视频一区视频二区在线观看| 国产日韩亚洲欧美综合| 在线观看国产91| 韩国av一区二区三区| 亚洲视频你懂的| 日韩一级成人av| 91免费视频网| 国产一区在线视频| 亚洲二区视频在线| 中文无字幕一区二区三区| 欧美日本一区二区三区四区| 成人短视频下载| 蜜桃av一区二区三区| 日韩美女久久久| 久久精品综合网| 欧美电影一区二区| 99re热这里只有精品视频| 国内成人免费视频| 首页国产欧美日韩丝袜| 日韩理论在线观看| 国产网站一区二区| 欧美一区二区三区成人| 99久久精品免费看| 国产精品一区二区你懂的| 三级久久三级久久久| 亚洲色大成网站www久久九九| 精品国产乱子伦一区| 欧美久久久久免费| 在线一区二区三区四区五区| 高清不卡一区二区| 狠狠色丁香九九婷婷综合五月| 一区二区三区电影在线播| 国产精品久久久久永久免费观看| 欧美成人免费网站| 欧美日韩色综合| 欧美在线视频全部完| av中文字幕一区| 成人av先锋影音| 岛国一区二区三区| 国产成人亚洲综合色影视| 久久国产综合精品| 免费精品视频最新在线| 五月开心婷婷久久| 欧美mv日韩mv亚洲| 欧美高清激情brazzers| 色婷婷精品大在线视频| av在线综合网| 99视频超级精品| 91在线视频播放地址| av一区二区不卡| 99国内精品久久| 色欧美乱欧美15图片| 色视频一区二区| 欧美午夜精品一区二区三区| 欧美性感一区二区三区| 欧美视频一区在线| 欧美乱妇15p| 日韩欧美一二三| 久久久综合网站| 亚洲国产精品av| 亚洲日本中文字幕区| 亚洲欧美aⅴ...| 亚洲一区二区三区爽爽爽爽爽 | 国产日韩av一区二区| 欧美韩国日本不卡| 亚洲人成精品久久久久久 | 欧美一级高清片| 欧美va亚洲va香蕉在线| 国产三级欧美三级| 综合网在线视频| 亚洲国产日韩a在线播放| 天天综合日日夜夜精品| 欧美96一区二区免费视频| 狠狠色丁香婷综合久久| 成人午夜精品在线| 在线观看网站黄不卡| 日韩欧美中文一区| 中文字幕av一区 二区| 亚洲综合免费观看高清在线观看| 日韩精品成人一区二区三区 | 国产精品色哟哟| 亚洲一区影音先锋| 精品一区二区国语对白| 东方aⅴ免费观看久久av| 成人一道本在线| 欧美最猛性xxxxx直播| 日韩一区二区免费电影| 国产精品久久久久久久久快鸭| 一区二区三区精密机械公司| 美女mm1313爽爽久久久蜜臀| 成人精品高清在线| 7777精品伊人久久久大香线蕉完整版| 精品国产青草久久久久福利| 亚洲欧洲成人av每日更新| 日韩av一级片| 99久久99久久精品免费观看| 日韩一区二区精品在线观看| 亚洲欧美日韩在线| 狠狠色伊人亚洲综合成人| 一本久久a久久免费精品不卡| 日韩免费观看高清完整版在线观看| 国产精品白丝在线| 麻豆91精品91久久久的内涵| 91丨porny丨蝌蚪视频| 精品剧情v国产在线观看在线| 亚洲乱码中文字幕综合| 国产精品99久久久久久有的能看| 欧美午夜视频网站| 日本一区二区在线不卡| 日产国产高清一区二区三区| 91在线看国产| 国产亚洲综合性久久久影院| 偷拍一区二区三区四区| 91美女视频网站| 国产日本欧洲亚洲| 毛片不卡一区二区| 天天综合色天天综合色h| 成人免费看的视频| 精品嫩草影院久久| 手机精品视频在线观看| 在线视频国内自拍亚洲视频| 国产亚洲人成网站| 精品一区二区三区在线播放| 欧美精品久久久久久久久老牛影院| 亚洲私人黄色宅男| 成人精品国产免费网站| 国产偷国产偷精品高清尤物| 久久99精品国产麻豆不卡| 欧美高清性hdvideosex| 亚洲一二三级电影|