国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    發布幾小時,微軟秒刪媲美GPT-4開源大模型!竟因忘記投毒測試

    2024年04月24日 09:12:22 來源:新智元公眾號

      前段時間,微軟公布并開源了最新一代大模型WizardLM-2,號稱性能堪比GPT-4。不過,還未上線一天,模型權重和公告全被刪除了,原因竟是......

      上周,微軟空降了一個堪稱GPT-4級別的開源模型WizardLM-2。

      卻沒想到發布幾小時之后,立馬被刪除了。

      有網友突然發現,WizardLM的模型權重、公告帖子全部被刪除,并且不再微軟集合中,除了提到站點之外,卻找不到任何證據證明這個微軟的官方項目。

      GitHub項目主頁已成404。

      包括模型在HF上的權重,也全部消失了.....

      全網滿臉疑惑,WizardLM怎么沒了?

      然鵝,微軟之所以這么做,是因為團隊內部忘記對模型做「測試」。

      隨后,微軟團隊現身道歉并解釋道,自幾個月前WizardLM發布以來有一段時間,所以我們對現在新的發布流程不太熟悉。

      我們不小心遺漏了模型發布流程中所需的一項內容 :投毒測試

      微軟WizardLM升級二代

      去年6月,基于LlaMA微調而來的初代WizardLM一經發布,吸引了開源社區一大波關注。

      論文地址:https://arxiv.org/pdf/2304.12244.pdf

      隨后,代碼版的WizardCoder誕生——一個基于Code Llama,利用Evol-Instruct微調的模型。

      測試結果顯示,WizardCoder在HumanEval上的pass@1達到了驚人的 73.2%,超越了原始GPT-4。

      時間推進到4月15日,微軟開發者官宣了新一代WizardLM,這一次是從Mixtral 8x22B微調而來。

      它包含了三個參數版本,分別是8x22B、70B和7B。

      最值得一提的是,在MT-Bench基準測試中,新模型取得了領先的優勢。

      具體來說,最大參數版本的WizardLM 8x22B模型性能,幾乎接近GPT-4和Claude 3。

      在相同參數規模下,70B版本位列第一。

      而7B版本是最快的,甚至可以達到與,參數規模10倍大的領先模型相當的性能。

      WizardLM 2出色表現的背后的秘訣在于,微軟開發的革命性訓練方法論Evol-Instruct。

      Evol-Instruct利用大型語言模型,迭代地將初始指令集改寫成越來越復雜的變體。然后,利用這些演化指令數據對基礎模型進行微調,從而顯著提高其處理復雜任務的能力。

      另一個是強化學習框架RLEIF,也在WizardLM 2開發過程中起到了重要作用。

      在WizardLM 2訓練中,還采用了AI Align AI(AAA)方法,可以讓多個領先的大模型相互指導和改進。

      AAA框架由兩個主要的組件組成,分別是「共同教學」和「自學」。

      共同教學這一階段,WizardLM和各種獲得許可的開源和專有先進模型進行模擬聊天、質量評判、改進建議和縮小技能差距。

      通過相互交流和提供反饋,模型可向同行學習并完善自身能力。

      對于自學,WizardLM可通過主動自學,為監督學習生成新的進化訓練數據,為強化學習生成偏好數據。

      這種自學機制允許模型通過學習自身生成的數據和反饋信息來不斷提高性能。

      另外,WizardLM 2模型的訓練使用了生成的合成數據。

      在研究人員看來,大模型的訓練數據日益枯竭,相信AI精心創建的數據和AI逐步監督的模型將是通往更強大人工智能的唯一途徑。

      因此,他們創建了一個完全由AI驅動的合成訓練系統來改進WizardLM-2。

      手快的網友,已經下載了權重

      然而,在資料庫被刪除之前,許多人已經下載了模型權重。

      在該模型被刪除之前,幾個用戶還在一些額外的基準上進行了測試。

      好在測試的網友對7B模型感到印象深刻,并稱這將是自己執行本地助理任務的首選模型。

      還有人對其進行了投毒測試,發現WizardLM-8x22B的得分為98.33,而基礎Mixtral-8x22B的得分為89.46,Mixtral 8x7B-Indict的得分為92.93。

      得分越高越好,也就是說WizardLM-8x22B還是很強的。

      如果沒有投毒測試,將模型發出來是萬萬不可的。

      大模型容易產生幻覺,人盡皆知。

      如果WizardLM 2在回答中輸出「有毒、有偏見、不正確」的內容,對大模型來說并不友好。

      尤其是,這些錯誤引來全網關注,對與微軟自身來說也會陷入非議之中,甚至會被當局調查。

      有網友疑惑道,你可以通過「投毒測試」更新指標。為什么要刪除整個版本庫和權重?

      微軟作者表示,根據內部最新的規定,只能這樣操作。

      還有人表示,我們就想要未經「腦葉切除」的模型。

      不過,開發者們還需要耐心等待,微軟團隊承諾,會在測試完成后重新上線。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    91行情网站电视在线观看高清版| 欧美伊人精品成人久久综合97| 中文字幕在线播放不卡一区| 国产三级精品视频| 精品国产91乱码一区二区三区| 欧美一区二区久久| 91精品久久久久久久久99蜜臂| 欧美三级电影在线看| 在线观看日韩国产| 欧美日韩一区二区三区不卡| 欧美日韩一区二区三区在线看| 欧美日韩久久久一区| 91精品久久久久久久99蜜桃| 日韩欧美www| 国产日本亚洲高清| 自拍偷拍欧美激情| 亚洲综合免费观看高清完整版 | 日日摸夜夜添夜夜添亚洲女人| 亚洲综合色在线| 日韩黄色小视频| 国产一区在线观看视频| 成人app软件下载大全免费| 91片黄在线观看| 欧美一区二区视频在线观看2022 | 久久久777精品电影网影网 | 国产suv精品一区二区883| voyeur盗摄精品| 欧美日韩久久一区二区| 精品久久一区二区| 亚洲欧洲99久久| 日韩精品一二三区| 成人av在线网站| 欧美一区二区三区视频免费| 国产精品视频你懂的| 午夜久久久久久| 国产98色在线|日韩| 欧美色区777第一页| 国产婷婷色一区二区三区四区 | 欧美美女激情18p| 亚洲国产成人在线| 五月激情综合色| www.一区二区| 欧美成人在线直播| 一区二区三区日本| 国产丶欧美丶日本不卡视频| 欧美日韩一区成人| 18欧美亚洲精品| 国产在线不卡一区| 欧美喷水一区二区| 亚洲欧洲成人自拍| 国产精品1区2区3区| 欧美日韩1区2区| 成人欧美一区二区三区黑人麻豆 | 欧美午夜寂寞影院| 国产精品久久久久影院色老大| 青青青伊人色综合久久| 色先锋aa成人| 久久久激情视频| 蜜臀久久久久久久| 欧美伊人久久久久久久久影院| 中文字幕二三区不卡| 狠狠色丁香九九婷婷综合五月| 欧美精品一卡两卡| 亚洲国产成人精品视频| 一本一本久久a久久精品综合麻豆| 久久久不卡影院| 精品一区二区三区日韩| 3d成人动漫网站| 亚洲成av人片一区二区梦乃| 91麻豆swag| 中文字幕乱码日本亚洲一区二区| 久国产精品韩国三级视频| 制服丝袜国产精品| 日本在线不卡一区| 在线成人免费视频| 午夜激情一区二区三区| 欧美日韩久久久久久| 亚洲一区二区精品3399| 欧美日韩在线直播| 日本在线播放一区二区三区| 宅男在线国产精品| 强制捆绑调教一区二区| 91精品国产综合久久久久| 奇米精品一区二区三区在线观看一| 欧美午夜精品免费| 爽好久久久欧美精品| 欧美一区二区性放荡片| 久久99热狠狠色一区二区| 久久综合精品国产一区二区三区| 国产伦精一区二区三区| 中文字幕国产一区二区| 91麻豆免费观看| 午夜久久久影院| 精品国产免费一区二区三区香蕉| 国产综合色产在线精品| 国产精品国产自产拍高清av王其| 91视频91自| 亚洲高清久久久| 欧美mv日韩mv国产网站| 国产成人在线色| 亚洲同性gay激情无套| 欧美人体做爰大胆视频| 毛片av中文字幕一区二区| 国产偷v国产偷v亚洲高清| 日本福利一区二区| 麻豆91精品91久久久的内涵| 国产日韩视频一区二区三区| 91亚洲男人天堂| 日本vs亚洲vs韩国一区三区 | 日韩你懂的在线播放| 国产成人精品影院| 亚洲男人的天堂一区二区| 3d动漫精品啪啪1区2区免费| 国产精品一区在线| 亚洲免费视频成人| 日韩久久久久久| 91麻豆免费观看| 激情伊人五月天久久综合| 亚洲欧美自拍偷拍色图| 欧美一区二区大片| jlzzjlzz欧美大全| 免费在线观看精品| 亚洲色图清纯唯美| 欧美精品一区二区三区在线播放| 91麻豆免费观看| 国内一区二区视频| 午夜精品免费在线| 国产精品国产三级国产aⅴ入口| 欧美精品乱码久久久久久按摩| 国产.欧美.日韩| 男女男精品网站| 亚洲欧美一区二区三区极速播放| 欧美成人a∨高清免费观看| 色先锋aa成人| 成人av网站大全| 美女www一区二区| 亚洲在线免费播放| 国产精品每日更新| 久久久噜噜噜久噜久久综合| 777亚洲妇女| 欧美在线影院一区二区| 成人sese在线| 国内精品写真在线观看| 日韩主播视频在线| 亚洲成人自拍网| 有码一区二区三区| 中文字幕一区二区三区四区不卡| 久久看人人爽人人| 欧美成人在线直播| 欧美一区日韩一区| 欧美高清你懂得| 欧美日韩日日骚| 欧美亚洲精品一区| 91传媒视频在线播放| 99久久精品国产毛片| 国产91高潮流白浆在线麻豆| 国精产品一区一区三区mba桃花| 免费观看在线综合色| 日韩经典一区二区| 偷拍一区二区三区四区| 亚洲综合自拍偷拍| 亚洲一区自拍偷拍| 亚洲国产wwwccc36天堂| 一区二区久久久| 亚洲一区二区三区在线看| 亚洲精品高清在线| 亚洲一区影音先锋| 午夜精品一区二区三区三上悠亚| 亚洲国产一区二区三区| 亚洲午夜视频在线观看| 性感美女久久精品| 蜜臀精品久久久久久蜜臀| 精品在线视频一区| 国产高清在线精品| 99国产精品一区| 欧洲av一区二区嗯嗯嗯啊| 欧美亚洲国产一区二区三区 | 欧美日韩亚洲综合一区二区三区| 欧美性xxxxx极品少妇| 欧美色手机在线观看| 91精品综合久久久久久| 日韩免费成人网| 国产喷白浆一区二区三区| 中文一区二区在线观看| 亚洲欧洲韩国日本视频| 亚洲一区二区免费视频| 蜜桃久久av一区| 国产成人在线视频网站| 一本色道久久综合精品竹菊| 欧美日免费三级在线| 欧美成人女星排行榜| 国产精品久久三| 亚洲电影视频在线| 精品中文字幕一区二区小辣椒| 丁香婷婷综合网| 欧美三级视频在线| 久久久美女艺术照精彩视频福利播放| 国产精品你懂的在线欣赏| 亚洲成av人片观看| 从欧美一区二区三区|