国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    1000萬上下文!新開源多模態大模型,單個GPU就能運行

    2025年04月07日 09:22:22 來源:AIGC開放社區公眾號

      今年2月初,谷歌發布的Gemini2.0Pro支持200萬上下文,震驚了整個大模型領域。

      僅過了2個月,Meta最新開源的Llama4Scout就將上下文擴展至1000萬,整整提升了5倍開啟千萬級時代。對于這么大的窗口大家可能沒什么概念,普通版本的《戰爭與和平》大概有1300頁100萬字左右,Llama4Scout可以一次性解讀這本書。

      如果你開發完一個項目想讓大模型幫你檢查一下是否有BUG、可優化的地方,只要代碼少于1000萬token,Llama4Scout都能幫你解決。驚不驚喜,整個代碼庫都成提示詞了~

      Llama4Scout簡單介紹

      Llama4Scout是一個專家混合架構模型,一共有1090億參數。其中,有170億活躍參數和16個專家路由,能在單個***GPU上使用,具備原生多模態的能力,可以處理文本和圖像,支持最多8張圖像的輸入。

      架構創新方面,Llama4Scout使用了無位置交叉嵌入的交錯注意層NoPE。傳統的Transformer架構通過位置編碼將每個單詞的位置信息嵌入到模型中,從而使模型能夠區分不同位置的單詞。

      但這種顯式的位置編碼方法在長度泛化方面存在局限性。例如,當模型在訓練時接觸到的序列長度較短,在測試時需要處理更長的序列時,顯式位置編碼可能無法有效地泛化到這些未見過的長度。而NoPE可以很好解決這個難題。

      NoPE的設計非常簡潔,就是直接移除了Transformer模型中的位置編碼部分。這意味著使用NoPE架構的模型中,輸入序列的單詞不會被附加任何顯式的位置信息。模型僅依賴于其自注意力機制和前饋網絡來處理序列數據。

      在NoPE模型的第一層中,通過特定的權重設置,模型可以恢復輸入序列的絕對位置信息。模型可以通過自注意力機制和前饋網絡將絕對位置信息寫入隱藏狀態。這一過程依賴于模型的因果注意力掩碼和softmax函數,使得模型能夠從輸入序列中恢復絕對位置信息。

      在后續層中,NoPE可以實現相對位置編碼。通過特定的權重設置,模型可以使得注意力機制依賴于單詞之間的相對距離,而不是絕對位置。NoPE可以捕捉到單詞之間的相對位置信息,從而實現相對位置編碼。

      根據測試數據顯示,NoPE在長度泛化方面表現出色,超過了所有顯式位置編碼方法。在多種推理和數學任務中,NoPE能夠成功地從較短的訓練序列泛化到更長的測試序列。

      例如,在加法任務中,NoPE在長度為40的序列上的準確率達到了0.69,而其他位置編碼方法的準確率均低于0.55。這表明NoPE能夠更好地捕捉序列中的數學規律,并將其應用于更長的序列。

      NoPE的計算效率也更高。由于不需要計算額外的注意力機制項,因此在訓練和推理過程中都能節省時間和計算資源,尤其是在需要處理長序列的任務中。

      所以,Llama4Scout擁有1000萬上下文卻能在單個***使用,NoPE發揮了非常大的作用。

      訓練數據方面,Llama4Scout使用了30萬億token數據,包括文本、圖像、視頻,比之前開源的Llama3高兩倍。

      此外,Llama4Scout在預訓練階段還特別注重多語言能力的培養,在200種語言上進行了訓練,其中包括超過100種擁有超過10億標記的語言,使得Llama4Scout在處理跨語言任務時具備了強大的語言理解和生成能力。

      媲美DeepSeek V3的新模型

      除了Llama4Scout,Meta還開源了一個模型Llama4Maverick,同樣是專家混合模型,一共有4000億參數。其中,170億參數處于活躍狀態和128個專家路由。同樣可以在單個***運行,不過只有100萬上下文。

      Maverick使用的訓練方法和數據與Scout差不多。根據公布的測試數據顯示,Maverick在MMLU/Pro、GPQA、DocVQA、MathVista超過了谷歌的Gemini2.0和OpenAI的GPT-4o,可以媲美DeepSeek最新開源的V3模型。

      訓練創新方面,Meta在訓練Maverick時,用了一種新辦法來優化訓練流程包括三個步驟:先進行輕量級監督微調(SFT),接著開展在線強化學習(RL),最后做輕量級直接偏好優化(DPO)。

      但在這個過程中,有一個重要問題:SFT和DPO這兩個步驟,可能會對模型限制得太厲害。這就會讓模型在在線RL這個階段沒辦法充分地去探索各種可能性,結果就是模型在做推理、編碼以及數學相關任務的時候,算得沒那么準表現不佳。

      為了解決這個難題,Meta剔除了超過50%被標記為“簡單”的數據,并在剩余更具挑戰性的數據集上進行輕量級SFT。在隨后的多模態在線RL階段,通過精心挑選更具挑戰性的提示,實現了性能的顯著提升。

      此外,Meta實施了連續在線RL策略,即交替進行模型訓練,然后利用訓練好的模型持續篩選并僅保留中等至較難難度的提示。

      事實證明,這種策略在計算成本和準確性的權衡方面非常有效。接著進行了輕量級DPO,以處理與模型響應質量相關的極端情況,有效地在模型的智能和對話能力之間實現了良好的平衡

      正訓練2萬億參數教師模型——Llama4Behemoth

      Meta表示,Scout和Maverick只是開源的首批Llama4系列模型。正在訓練一個總參數2萬億,活躍參數2880億活躍參數和16個專家路由的教師模型——Llama4Behemoth。

      Llama4Behemoth主要用于蒸餾、微調小模型,Llama4Maverick便是通過它完成的。為了實現性能的最大化,Meta對SFT數據進行大幅刪減,要剪掉95%的數據,而較小的模型僅需剪掉50%,以此來實現對質量和效率的必要關注。

      由于兩萬億參數模型前所未有的規模,為其擴展強化學習(RL)還需要對底層的強化學習基礎設施進行改造。

      Meta開發了一個完全異步的在線強化學習訓練框架,增強了靈活性。現有的分布式訓練框架為了將所有模型堆疊到內存中,犧牲了計算內存。新基礎設施能夠將不同模型靈活分配到單獨的GPU上,根據計算速度在多個模型之間平衡資源,訓練效率比上一代提升了大約10倍。

      根據實驗數據顯示,Llama4Behemoth在MMLU Pro、GPQA、MATH-500等測試的數據比GPT-4.5、Claude Sonnet3.7、Gemini2.0Pro更好。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    欧美一区二区福利视频| 91在线观看成人| 91丝袜国产在线播放| 久久99精品久久只有精品| 日本一区二区三区久久久久久久久不| a美女胸又www黄视频久久| 亚洲一区影音先锋| 日韩色在线观看| av爱爱亚洲一区| 国产成人精品一区二区三区网站观看| 亚洲毛片av在线| 337p粉嫩大胆色噜噜噜噜亚洲 | 日本怡春院一区二区| 中文成人av在线| 欧美日韩国产在线观看| 成人午夜激情视频| 日韩精品乱码免费| 亚洲男女一区二区三区| 樱桃国产成人精品视频| 国产女人水真多18毛片18精品视频| 久久综合一区二区| 国产精品美女久久久久aⅴ| 亚洲色图在线视频| 中文字幕久久午夜不卡| 在线播放亚洲一区| 一本色道综合亚洲| 黄页网站大全一区二区| 亚洲网友自拍偷拍| 亚洲线精品一区二区三区 | 美腿丝袜亚洲一区| 亚洲动漫第一页| 精品在线一区二区三区| 99久久99精品久久久久久| 成人av在线资源网| 精品一二线国产| 波多野结衣视频一区| 欧美精品一级二级三级| 国产视频一区在线播放| 久久婷婷国产综合精品青草| 国产精品的网站| 国产精品久久久久久久岛一牛影视| 亚洲另类一区二区| 国产一区二区导航在线播放| 九色综合狠狠综合久久| 99精品视频免费在线观看| 欧美丰满高潮xxxx喷水动漫| 国产女同互慰高潮91漫画| 天天综合网 天天综合色| 日本美女视频一区二区| 成人免费av在线| 欧美久久一二区| 成人欧美一区二区三区1314| 亚洲日本乱码在线观看| 麻豆成人久久精品二区三区小说| 成人午夜视频免费看| 91精品国产一区二区三区| 亚洲精品中文字幕在线观看| 粉嫩蜜臀av国产精品网站| 99久久婷婷国产综合精品电影 | 日欧美一区二区| 99精品欧美一区| 久久美女艺术照精彩视频福利播放| 精品国产成人在线影院| 精品成人a区在线观看| 亚洲男人的天堂在线aⅴ视频| 韩国三级中文字幕hd久久精品| 欧美性感一类影片在线播放| 在线成人午夜影院| 亚洲婷婷综合色高清在线| 国产在线看一区| 欧美一区二区在线免费观看| 又紧又大又爽精品一区二区| a亚洲天堂av| 国产精品亲子乱子伦xxxx裸| 国产高清精品网站| 欧美国产一区在线| 国产剧情一区二区| 欧洲av在线精品| 日韩欧美激情四射| 国产精品免费av| 国产福利精品一区| 久久久久久99精品| 国产美女在线观看一区| 久久久久久免费| 成人免费精品视频| 亚洲色图在线播放| 色88888久久久久久影院按摩| 日韩免费高清电影| 久久99国产精品免费网站| 欧美大胆一级视频| 精品一二三四在线| 国产欧美久久久精品影院| 成人免费毛片高清视频| 综合久久给合久久狠狠狠97色 | 午夜精品久久久| 3atv一区二区三区| 亚洲图片另类小说| 色综合久久久久综合99| 一区二区免费看| aaa亚洲精品| 亚洲综合在线视频| 69精品人人人人| 久久99国产精品免费网站| 久久久久久久综合日本| 9色porny自拍视频一区二区| 一区二区三区免费看视频| 91麻豆精品国产综合久久久久久| 精油按摩中文字幕久久| 中文字幕一区免费在线观看 | 中文无字幕一区二区三区| 一本一道久久a久久精品| 五月婷婷激情综合网| 久久精品人人爽人人爽| 91久久精品一区二区三| 精品在线免费视频| 最新成人av在线| 日韩一区二区麻豆国产| 99re这里都是精品| 久久电影网站中文字幕 | 国产偷国产偷精品高清尤物| 色综合久久久久综合体桃花网| 免费欧美日韩国产三级电影| 4438成人网| heyzo一本久久综合| 日韩福利视频网| 亚洲欧洲精品一区二区精品久久久 | 91黄色免费观看| 经典三级一区二区| 亚洲综合色自拍一区| 国产欧美日韩亚州综合 | 国产精一品亚洲二区在线视频| 亚洲午夜激情网站| 欧美高清在线视频| 欧美大肚乱孕交hd孕妇| 欧美在线999| 99re8在线精品视频免费播放| 久久99久久久久久久久久久| 夜夜爽夜夜爽精品视频| 国产精品免费人成网站| 26uuu另类欧美| 91精品国产aⅴ一区二区| 一本一道久久a久久精品| 成人晚上爱看视频| 国产精品一品二品| 麻豆精品久久久| 丝袜a∨在线一区二区三区不卡 | 成人蜜臀av电影| 久久超碰97中文字幕| 五月婷婷色综合| 亚洲无人区一区| 亚洲精品第一国产综合野| 综合久久久久久久| 亚洲同性gay激情无套| 国产精品久久久久一区二区三区| 欧美精品一区二区三区蜜桃视频 | 日韩欧美激情一区| 日韩小视频在线观看专区| 欧美精品第一页| 欧美高清激情brazzers| 在线免费精品视频| 欧美亚一区二区| 欧美这里有精品| 欧美日韩国产综合一区二区 | 日韩欧美一二三四区| 欧美一区二区三区免费视频 | 懂色av一区二区在线播放| 国产乱色国产精品免费视频| 国产一二三精品| 国产99久久精品| av在线免费不卡| 欧美自拍丝袜亚洲| 9191成人精品久久| 精品动漫一区二区三区在线观看| 国产午夜精品久久久久久久 | 亚洲成a人v欧美综合天堂下载| 日韩视频在线一区二区| 欧美日韩精品一区二区在线播放 | 久久九九国产精品| 国产精品国模大尺度视频| 亚洲视频你懂的| 亚洲成人免费视频| 美日韩一区二区| 成人97人人超碰人人99| 欧美日韩一区中文字幕| 成人一道本在线| 99免费精品在线| 91.麻豆视频| 国产亚洲欧美日韩日本| 亚洲天堂2014| 日韩精品午夜视频| 国产成人免费视频网站高清观看视频| 91在线观看免费视频| 欧美放荡的少妇| 中文字幕精品一区二区精品绿巨人| 综合电影一区二区三区| 日韩精品亚洲一区二区三区免费| 国产精品一二三区在线| 欧美日韩免费观看一区二区三区 | 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 2020日本不卡一区二区视频|