" />

国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

蔚來智駕芯片神璣NX9031開啟“賺錢”模式 已向一公司提供技術(shù)授權(quán)東風(fēng)汽車布局低空技術(shù),首臺馬赫動力2.0T飛行發(fā)動機(jī)交付華為“碰一碰”新專利公布:重塑內(nèi)容分享模式 引領(lǐng)設(shè)備交互新范式級數(shù)AI與阿里云達(dá)成全棧AI戰(zhàn)略合作奇瑞風(fēng)云 T9L 官宣 2025 廣州車展首發(fā)亮相諾基亞公布全新戰(zhàn)略:聚焦 AI 驅(qū)動的網(wǎng)絡(luò)變革,整合為兩大核心業(yè)務(wù)板塊夸克 AI 眼鏡與支付寶合作升級,新增骨傳導(dǎo)拾音、準(zhǔn)心等獨(dú)家能力東軟云科技入選福布斯中國“2025出海全球化領(lǐng)軍品牌TOP30”11月24日榮耀500系列發(fā)布 來京東1元鎖定“龍馬金繩”真金禮盒同款iPad Air京東比Apple官方便宜上千元 全國可用的政府補(bǔ)貼真香縱橫G700迪拜上市:中國豪華越野的全球奢享宣言華為Mate X7今日開啟預(yù)訂 搭載第二代紅楓影像等配置百度Q3 AI收入96億元同比增50%,蘿卜快跑出行量翻倍榮耀500全系搭載驍龍8系旗艦芯華為MatePad Edge首次實(shí)現(xiàn)平板、電腦深度融合:四指橫滑無縫切換千問登場,阿里瞄準(zhǔn)C端關(guān)鍵一戰(zhàn)“雙十一”履約時效“卷”至分鐘級,順豐同城全場景全渠道單量顯著增長工信部:到2027年,建成200個左右高標(biāo)準(zhǔn)數(shù)字園區(qū)飛利浦Evnia弈威推27M2N6501L顯示器:27" QHD 240Hz QD-OLEDQuestMobile2025年雙十一洞察報告:平臺間用戶爭奪戰(zhàn)激烈
  • 首頁 > 數(shù)據(jù)存儲頻道 > 數(shù)據(jù).存儲頻道 > 存儲資訊

    消費(fèi)級GPU成功運(yùn)行1760億參數(shù)大模型

    2022年08月22日 19:30:43 來源:機(jī)器之心

      在消費(fèi)級 GPU 上運(yùn)行大規(guī)模模型是機(jī)器學(xué)習(xí)社區(qū)正面臨的挑戰(zhàn)。

      語言模型的規(guī)模一直在變大,PaLM 有 540B 參數(shù),OPT、GPT-3 和 BLOOM 有大約 176B 參數(shù),模型還在朝著更大的方向發(fā)展。

      這些模型很難在易于訪問的設(shè)備上運(yùn)行。例如,BLOOM-176B 需要在 8 個 80GB A100 GPU(每個約 15000 美元)上運(yùn)行才能完成推理任務(wù),而微調(diào) BLOOM-176B 則需要 72 個這樣的 GPU。PaLM 等更大的模型將需要更多的資源。

      我們需要找到方法來降低這些模型的資源需求,同時保持模型的性能。領(lǐng)域內(nèi)已經(jīng)開發(fā)了各種試圖縮小模型大小的技術(shù),例如量化和蒸餾。

      BLOOM 是去年由 1000 多名志愿研究人員在一個名為「BigScience」的項目中創(chuàng)建的,該項目由人工智能初創(chuàng)公司 Hugging Face 利用法國政府的資金運(yùn)作,今年 7 月 12 日 BLOOM 模型正式發(fā)布。

      使用 Int8 推理會大幅減少模型的內(nèi)存占用,卻不會降低模型的預(yù)測性能。基于此,來自華盛頓大學(xué)、Meta AI 研究院等(原 Facebook AI Research )機(jī)構(gòu)的研究員聯(lián)合 HuggingFace 開展了一項研究,試圖讓經(jīng)過訓(xùn)練的 BLOOM-176B 在更少的 GPU 上運(yùn)行,并將所提方法完全集成到 HuggingFace Transformers 中。

      論文地址:https://arxiv.org/pdf/2208.07339.pdf

      Github 地址:https://github.com/timdettmers/bitsandbytes

      該研究為 transformer 提出了首個數(shù)十億規(guī)模的 Int8 量化過程,該過程不會影響模型的推理性能。它可以加載一個具有 16-bit 或 32-bit 權(quán)重的 175B 參數(shù)的 transformer,并將前饋和注意力投影層轉(zhuǎn)換為 8-bit。其將推理所需的內(nèi)存減少了一半,同時保持了全精度性能。

      該研究將向量量化和混合精度分解的組合命名為 LLM.int8()。實(shí)驗(yàn)表明,通過使用 LLM.int8(),可以在消費(fèi)級 GPU 上使用多達(dá) 175B 參數(shù)的 LLM 執(zhí)行推理,而不會降低性能。該方法不僅為異常值對模型性能的影響提供了新思路,還首次使在消費(fèi)級 GPU 的單個服務(wù)器上使用非常大的模型成為可能,例如 OPT-175B/BLOOM。

      方法簡介

      機(jī)器學(xué)習(xí)模型的大小取決于參數(shù)的數(shù)量及其精度,通常是 float32、float16 或 bfloat16 之一。float32 (FP32) 代表標(biāo)準(zhǔn)化的 IEEE 32 位浮點(diǎn)表示,使用這種數(shù)據(jù)類型可以表示范圍廣泛的浮點(diǎn)數(shù)。FP32 為「指數(shù)」保留 8 位,為「尾數(shù)」保留 23 位,為數(shù)字的符號保留 1 位。并且,大多數(shù)硬件都支持 FP32 操作和指令。

      而 float16 (FP16) 為指數(shù)保留 5 位,為尾數(shù)保留 10 位。這使得 FP16 數(shù)字的可表示范圍遠(yuǎn)低于 FP32,面臨溢出(試圖表示一個非常大的數(shù)字)和下溢(表示一個非常小的數(shù)字)的風(fēng)險。

      出現(xiàn)溢出時會得到 NaN(非數(shù)字)的結(jié)果,如果像在神經(jīng)網(wǎng)絡(luò)中那樣進(jìn)行順序計算,那么很多工作都會崩潰。bfloat16 (BF16) 則能夠避免這種問題。BF16 為指數(shù)保留 8 位,為小數(shù)保留 7 位,意味著 BF16 可以保留與 FP32 相同的動態(tài)范圍。

      理想情況下,訓(xùn)練和推理應(yīng)該在 FP32 中完成,但它的速度比 FP16/BF16 慢,因此要使用混合精度來提高訓(xùn)練速度。但在實(shí)踐中,半精度權(quán)重在推理過程中也能提供與 FP32 相似的質(zhì)量。這意味著我們可以使用一半精度的權(quán)重并使用一半的 GPU 來完成相同的結(jié)果。

      但是,如果我們可以使用不同的數(shù)據(jù)類型以更少的內(nèi)存存儲這些權(quán)重呢?一種稱為量化的方法已廣泛用于深度學(xué)習(xí)。

      該研究首先在實(shí)驗(yàn)中用 2-byte BF16/FP16 半精度代替 4-byte FP32 精度,實(shí)現(xiàn)了幾乎相同的推理結(jié)果。這樣一來,模型減小了一半。但是如果進(jìn)一步降低這個數(shù)字,精度會隨之降低,那推理質(zhì)量就會急劇下降。

      為了彌補(bǔ)這一點(diǎn),該研究引入 8bit 量化。這種方法使用四分之一的精度,因此只需要四分之一模型大小,但這不是通過去除另一半 bit 來實(shí)現(xiàn)的。

      兩種最常見的 8-bit 量化技術(shù)為 zero-point 量化和 absmax(absolute maximum)量化。這兩種方法將浮點(diǎn)值映射為更緊湊的 int8(1 字節(jié))值。

      例如,在 zero-point 量化中,如果數(shù)據(jù)范圍是 -1.0——1.0,量化到 -127——127,其擴(kuò)展因子為 127。在這個擴(kuò)展因子下,例如值 0.3 將被擴(kuò)展為 0.3*127 = 38.1。量化通常會采用四舍五入(rounding),得到了 38。如果反過來,將得到 38/127=0.2992——在這個例子中有 0.008 的量化誤差。這些看似微小的錯誤在通過模型層傳播時往往會累積和增長,并導(dǎo)致性能下降。

      雖然這些技術(shù)能夠量化深度學(xué)習(xí)模型,但它們通常會導(dǎo)致模型準(zhǔn)確率下降。但是集成到 Hugging Face Transformers 和 Accelerate 庫中的 LLM.int8(),是第一種即使對于帶有 176B 參數(shù)的大型模型 (如 BLOOM) 也不會降低性能的技術(shù)。

      LLM.int8()算法可以這樣解釋,本質(zhì)上,LLM.int8()試圖通過三個步驟來完成矩陣乘法計算:

      從輸入隱藏狀態(tài)中,按列提取異常值(即大于某個閾值的值)。

      將 FP16 中的異常值與 int8 中的非異常值進(jìn)行矩陣乘法。

      在 FP16 中對非異常值進(jìn)行去量化,將異常值和非異常值相加,得到完整的結(jié)果。

      這些步驟可以在下面的動畫中總結(jié):

      最后,該研究還關(guān)注了一個問題:速度比原生模型更快嗎?

      LLM.int8() 方法的主要目的是使大型模型更易于訪問而不會降低性能。但是,如果它非常慢,那么用處也不大了。研究團(tuán)隊對多個模型的生成速度進(jìn)行了基準(zhǔn)測試,發(fā)現(xiàn)帶有 LLM.int8() 的 BLOOM-176B 比 fp16 版本慢了大約 15% 到 23%——這是完全可以接受的。而較小的模型(如 T5-3B 和 T5-11B)的減速幅度更大。研究團(tuán)隊正在努力提升這些小型模型的運(yùn)行速度。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實(shí)、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場占比高達(dá)35.8%,阿里云引領(lǐng)中國AI云增長

    9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計劃發(fā)布會。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    久久久精品日韩欧美| 老司机精品视频线观看86| 91精品国产色综合久久 | 男女性色大片免费观看一区二区 | 蜜桃视频在线观看一区二区| 日韩精品免费视频人成| 亚洲精品国产一区二区三区四区在线| 91精品国产91综合久久蜜臀| 在线成人av影院| 欧美视频完全免费看| 日本韩国精品在线| 在线免费观看日韩欧美| 日本电影欧美片| 欧美伊人久久久久久久久影院| 欧美日韩一区在线| 日韩欧美电影一二三| 久久九九全国免费| 日韩一区在线免费观看| 午夜久久久影院| 国产精品一区二区91| 粉嫩aⅴ一区二区三区四区五区| 91免费观看国产| 欧美一级黄色录像| 国产精品私人自拍| 一区二区高清视频在线观看| 一区二区三区丝袜| 欧美午夜一区二区| 欧美久久久久久久久| www亚洲一区| 亚洲免费在线观看视频| 青青草成人在线观看| 成人毛片在线观看| 欧美精品欧美精品系列| 国产亚洲短视频| 亚洲成人午夜影院| 成人综合在线网站| 欧美日韩电影在线播放| 日本一区二区三区在线不卡| 午夜亚洲福利老司机| 东方欧美亚洲色图在线| 欧美性xxxxxxxx| 中文字幕va一区二区三区| 日本成人中文字幕| 不卡av在线网| 欧美精品一区二区三| 夜夜嗨av一区二区三区中文字幕| 精品一区二区在线看| 色乱码一区二区三区88| 精品国产伦理网| 亚洲午夜激情av| 不卡免费追剧大全电视剧网站| 日韩欧美在线1卡| 亚洲线精品一区二区三区八戒| 国产成人精品一区二| 日韩亚洲欧美在线| 亚洲激情六月丁香| 99久久夜色精品国产网站| 精品区一区二区| 性感美女久久精品| 精品视频一区三区九区| 日韩美女视频一区| www.爱久久.com| 国产精品免费视频一区| 国产剧情一区在线| 精品国产污网站| 蜜臀久久99精品久久久久久9| 欧美日韩中文一区| 亚洲国产一二三| 色综合视频在线观看| 一区免费观看视频| 97精品国产97久久久久久久久久久久 | 国产成人精品1024| 精品国产123| 精品一区二区在线播放| 日韩欧美高清在线| 久久国产综合精品| 精品福利av导航| 国产精品中文字幕欧美| 久久精品视频免费| 国产成都精品91一区二区三| 国产婷婷色一区二区三区在线| 久久精品72免费观看| 日韩欧美不卡在线观看视频| 成人国产亚洲欧美成人综合网| 久久国产视频网| 欧美日韩国产色站一区二区三区| 一区二区三区四区激情| 色老汉一区二区三区| 一区二区欧美国产| 欧美剧情片在线观看| 天天综合天天做天天综合| 欧美日韩一区二区在线观看视频| 亚洲五码中文字幕| 91精品欧美福利在线观看| 日韩二区三区在线观看| 欧美xxxx在线观看| 国产91精品免费| 国产精品国产精品国产专区不片| 成人免费毛片高清视频| 中文一区二区在线观看| 99精品视频在线免费观看| 一区二区三区日韩精品视频| 777久久久精品| 国产jizzjizz一区二区| 亚洲免费伊人电影| 欧美喷水一区二区| 丝袜美腿亚洲一区| 国产性做久久久久久| 91福利在线免费观看| 亚洲高清一区二区三区| 911精品产国品一二三产区| 国产伦精品一区二区三区免费| 中文字幕成人av| 欧美日韩免费在线视频| 国产在线精品视频| 亚洲美女在线国产| 日韩西西人体444www| 国产麻豆视频一区| 亚洲三级电影网站| 日韩欧美一级二级| 91麻豆成人久久精品二区三区| 国产精品成人免费| 欧美一级黄色大片| 成人国产精品免费观看| 蜜桃av一区二区在线观看| 久久精品视频在线看| 欧美人伦禁忌dvd放荡欲情| 波多野洁衣一区| 久久国产精品区| 又紧又大又爽精品一区二区| 欧美精品 日韩| 91麻豆国产福利在线观看| 国产一区二区三区蝌蚪| 五月综合激情日本mⅴ| 国产精品免费av| 91精品婷婷国产综合久久性色| 色播五月激情综合网| 成人毛片老司机大片| 精品一区免费av| 麻豆精品在线播放| 亚洲人成网站在线| 中文字幕av一区 二区| 日韩一区二区三| 91麻豆国产自产在线观看| 粉嫩av一区二区三区粉嫩| 麻豆视频一区二区| 午夜精品福利在线| 亚洲综合色自拍一区| 国产日韩欧美麻豆| 欧美本精品男人aⅴ天堂| 在线日韩av片| 亚洲乱码中文字幕| 国产精品美女久久久久久久久久久 | 日本不卡高清视频| 亚洲高清三级视频| 亚洲尤物在线视频观看| 亚洲欧美日韩国产成人精品影院 | 亚洲欧美一区二区三区极速播放 | 亚洲激情男女视频| 国产精品乱码久久久久久| 久久综合五月天婷婷伊人| 欧美一区二区福利在线| 欧美日韩在线观看一区二区| 色嗨嗨av一区二区三区| 精品一区二区三区久久| 中文字幕亚洲视频| 国产精品久久久久影院亚瑟| 国产精品天天摸av网| 国产精品白丝在线| 中文字幕av一区二区三区免费看 | 一级中文字幕一区二区| 一个色综合网站| 亚洲一区二区免费视频| 亚洲自拍都市欧美小说| 亚洲欧美日韩电影| 综合色天天鬼久久鬼色| 亚洲欧美激情一区二区| 亚洲日本在线看| 一区二区成人在线视频| 日本女人一区二区三区| 狠狠久久亚洲欧美| 国产乱子伦视频一区二区三区 | 国产乱国产乱300精品| 国产盗摄精品一区二区三区在线| 国产九色sp调教91| 99国产欧美另类久久久精品| 一本高清dvd不卡在线观看| 欧美视频在线一区二区三区 | 亚洲综合在线观看视频| 一级中文字幕一区二区| 婷婷久久综合九色综合伊人色| 午夜精品一区二区三区电影天堂| 午夜精品久久久久久久久| 国产精品69久久久久水密桃| av中文一区二区三区| 在线免费观看日本一区| 欧美一区二区播放| 久久影音资源网| 中文字幕一区免费在线观看| 一区二区三区在线观看欧美|