国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

5G SA遷移加速 全球已有12家運營商推出5G-A商用網絡愛瑪馬赫發布會:四大場景全矩陣產品亮相 樹立兩輪商用出行新格局小米首款AI眼鏡更新發布 支持抖音直播、小愛控車2025年上半年小家電零售額增長9%,全年依然面臨增長壓力從“冷板凳”到主賽道,印刷OLED迎來發展拐點?空調競爭再加劇,小吉、巧康“入局”,中小品牌還有兩個機會下跌16%!10月彩電市場又創單月最大跌幅,第三名60萬臺多款知名品牌家用電動洗衣機產品抽查結果來了空氣炸鍋之王巧康進入空調領域 楊振巧被推遲了二十年的夢想三星采購京東方面板已翻倍!明年擴大合作天馬2025全球創新大會圓滿舉行:11項創新成果亮相,引領顯示技術新紀元雙11徹底變了,AI和即時零售正在書寫新故事打通商業航天堵點 規;a與高可靠發射是第一步“敢為不凡杯”TCL全球高校電子競技聯賽S4中國區總決賽謝幕,硬核科技與競技激情的雙向奔赴!松下電視授權在即?TCL會成為真正的“接盤俠”嗎微博Q3凈收入4.42億美元 最新月活躍用戶數達5.78億華為Mate 80系列備貨量出爐:主推Pro Max 標準版管夠放開買一加Ace 6T首發!高通第五代驍龍8首個跑分來了 多核超越驍龍8至尊版iPhone 17系列首發自研N1芯片:Wi-Fi速度超越上代iPhone 16繪就“內容+科技”價值共生新圖景 2025咪咕生態大會圓滿落幕
  • 首頁 > 云計算頻道 > 大模型

    對標GPT-4代碼解釋器!港中大讓模型寫代碼解決數學難題,得分超越GPT-4

    2023年10月08日 15:21:09 來源:微信公眾號 量子位

      本文來自于微信公眾號 量子位 (ID:QbitAI),作者:豐色。

      對標GPT-4代碼解釋器,港中大最新研究放了個“大招”:

      他們開發了一個叫做MathCoder的大模型,數學能力直接在競賽級“題庫”Math上超過GPT-4。

      做到這一點靠的就是無縫集成代碼的能力——

      在遇到數學問題時,它不僅能用自然語言推理,還能自動編寫和執行代碼來建模、推導公式與方程。

      這樣的工作方式無疑和強大的GPT-4代碼解釋器一樣。

      在實際評測中,MathCoder除了超過GPT-4,還順利在MATH和GSM8K兩大數據集上取得了開源LLM中的SOTA(打敗了8月份才誕生的WizardMath)

      這個“新王”究竟是如何誕生的?對標GPT-4代碼解釋器

      總的來看,港大這項研究為了提高大模型的數學推理能力,學習了GPT-4代碼解釋器的優點和工作原理,提出了一種微調開源語言模型的方法。

      該方法最終使大模型無縫集成代碼,利用代碼來解決數學問題。

      具體而言,他們首先提出了一個可以生成高質量數學題的數據集:MathCodeInstruct。

      該數據集由兩部分組成:

      種子數據(D0):主要基于GSM8K和MATH,并利用GPT-4收集答案。

      插值數據(D1):讓GPT-4基于他們提出的一種叫做“問題插值提示”的方法生成。

      如下圖所示:

      示例1和2分別來自于GSM8K和MATH,1簡單,2難一些,GPT-4要做的“插值”就是生成比1難但比2更簡單的新問題。

      基于以上兩類問題,最終MathCodeInstruct數據集一共收集了8萬道數學題。

      如下表所示,這比業內其他數據集規模稍小一些:

      而與其他數據集相比,它的特點之一是同時彌補了GSM8K和MATH這兩大重要數據集中不足的部分,給出了一些難度范圍更廣的問題,增強了數據集的泛化能力。

      特點之二是數據集中的每道題目同時包含基于自然語言推理的部分+基于代碼解決的部分(包括執行代碼和代碼輸出結果)。

      如下圖所示,這是對上面GPT-4生成的“插值”問題的解決思路:

      在數據集準備好以后,團隊便提出了一種定制的監督微調和推理方法,最終在Llama-2和Code Llama上微調出了MathCoder。

      具體而言,該方法使用特殊的token(<|text|>、<|code|>、<|execution|>)來識別訓練數據集中哪一部分是自然語言、代碼還是結果,讓模型學習生成由這些特殊標記劃分的自然語言和代碼。

      在推理期間,該方法還會將動態執行的結果附加到模型的先前預測中。

      然后,繼續基于這個新版本的輸入自回歸預測下一個token,以及最后的執行結果。

      作者表示,通過這種方式,模型將能夠“看到”執行結果,并不斷地繼續推理。

      最終,該方法使微調模型MathCoder以類似GPT-4代碼解釋器的方式運行。

      在評測中,MathCoder憑此直接在MATH和GSM8K這倆數據集上取得了45.2%和83.9%的好成績。

      該成績證明:

      其一,它超過了ChatGPT-3.5和PaLM-2等9個閉源模型,并在以數學競賽題為主的MATH集上超過GPT-4。

      其二,它打敗了此前數學領域里最強的開源模型WizardMath,成為新的開源之最。

      不過其三,模仿但還未超越,在這倆數據集上,MathCoder還是與GPT-4代碼解釋器(69.7%和97%高分)存在著一定的性能差距。 作者介紹

      本研究一共10位作者,除了兩位來自香港城市大學以外,其余均來自香港中文大學。

      共同一作一共有6位,分別是:Ke Wang、Houxing Ren、Aojun Zhou、Zimu Lu、Sichun Luo和Weikang Shi。

      通訊作者為李鴻升,為港中大電子工程系副教授,同時也就職于上海人工智能研究室。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    91丨porny丨蝌蚪视频| 欧美日韩一区二区在线视频| 亚洲另类在线一区| 国产精品美女久久久久久久网站| 26uuu色噜噜精品一区二区| 91精品国产91综合久久蜜臀| 91麻豆精品国产综合久久久久久 | 91香蕉视频mp4| 91视频.com| 欧美日韩亚洲综合一区二区三区| 欧美三级日韩在线| 91精品中文字幕一区二区三区| 欧美一区欧美二区| 国产女主播视频一区二区| 亚洲欧洲日韩av| 五月婷婷欧美视频| 国产一区在线观看视频| 成人av综合在线| 欧美日韩一本到| 久久久久久久电影| 亚洲综合男人的天堂| 日韩精品久久久久久| 国产麻豆视频一区| 欧美性受xxxx| 国产亚洲一二三区| 亚洲一区二区三区四区五区黄| 日本午夜精品一区二区三区电影| 国产精品一级在线| 欧美三级乱人伦电影| 精品国产免费人成在线观看| 国产精品国产三级国产| 视频一区二区三区中文字幕| 国产精品中文字幕欧美| 欧美日韩一级片网站| 久久久精品天堂| 亚洲国产精品久久久久秋霞影院| 国产一区二区免费在线| 欧美日韩免费在线视频| 亚洲国产精品成人综合色在线婷婷 | 国产精品蜜臀av| 亚洲图片欧美综合| 国产综合久久久久久鬼色| 91在线无精精品入口| 日韩亚洲欧美综合| 一区二区视频免费在线观看| 国产一区二区在线观看免费| 欧美日韩一卡二卡| 中文字幕日本乱码精品影院| 九色|91porny| 8x8x8国产精品| 亚洲毛片av在线| 国产成人av影院| 日韩精品在线网站| 亚洲福利一二三区| 99在线精品免费| 久久久精品综合| 九九九精品视频| 777久久久精品| 亚洲午夜电影在线观看| 一本一道综合狠狠老| 国产欧美日韩麻豆91| 麻豆91精品91久久久的内涵| 欧美性生活久久| 亚洲人被黑人高潮完整版| 成人性生交大片免费看在线播放| 欧美不卡视频一区| 日本少妇一区二区| 欧美日韩一级黄| 亚洲一区自拍偷拍| 一本色道久久加勒比精品 | 91老师片黄在线观看| 中文一区二区完整视频在线观看| 狠狠色丁香久久婷婷综合_中| 欧美日韩国产123区| 亚洲成a人片在线不卡一二三区| 色偷偷一区二区三区| 亚洲黄色录像片| 欧美综合久久久| 亚洲一区免费观看| 欧美午夜视频网站| 亚洲va中文字幕| 欧美一级欧美一级在线播放| 日韩激情在线观看| 精品国产乱子伦一区| 国产在线播放一区| 国产亚洲欧美在线| av不卡一区二区三区| 亚洲毛片av在线| 欧美日韩一区二区在线视频| 视频一区二区国产| 亚洲精品一区二区三区福利 | 国产精品每日更新在线播放网址| av不卡一区二区三区| 亚洲精品亚洲人成人网在线播放| 色视频一区二区| 午夜电影一区二区三区| 91精品国产福利| 国产成人精品免费在线| 亚洲日本一区二区三区| 91久久线看在观草草青青| 午夜在线成人av| 欧美成人精品高清在线播放 | 日韩精品在线网站| 波波电影院一区二区三区| 亚洲人成精品久久久久久| 91精品免费在线| 成人午夜激情在线| 亚洲h在线观看| 久久久天堂av| 在线影院国内精品| 激情欧美一区二区| 日韩伦理免费电影| 制服丝袜中文字幕亚洲| 国产99精品视频| 亚洲成av人片在线观看无码| 久久亚区不卡日本| 欧美日韩久久久一区| 国产成人精品亚洲午夜麻豆| 亚洲国产成人av| 国产日韩欧美高清| 欧美一区二区三区在线电影| 成人激情黄色小说| 精品一二三四在线| 亚洲福利视频一区| 国产精品不卡一区| 精品久久99ma| 欧美日韩国产经典色站一区二区三区| 国产精品一区二区免费不卡| 亚洲高清不卡在线| 亚洲天堂2014| 国产清纯在线一区二区www| 这里只有精品视频在线观看| 99精品欧美一区二区三区小说| 精品一区二区三区香蕉蜜桃 | 国产欧美一区二区三区鸳鸯浴| 制服丝袜在线91| 欧美色图片你懂的| av成人老司机| 国产91精品入口| 国产在线看一区| 日韩av不卡在线观看| 亚洲精品第一国产综合野| 亚洲国产经典视频| 国产偷国产偷亚洲高清人白洁| 日韩无一区二区| 在线综合视频播放| 欧美日韩高清在线播放| 在线一区二区三区四区五区 | 欧美精品日日鲁夜夜添| 色噜噜狠狠色综合欧洲selulu| 成人一区二区在线观看| 国产一区二区免费视频| 久久成人麻豆午夜电影| 免费在线观看精品| 视频一区二区三区在线| 午夜精品福利一区二区三区av | 一级做a爱片久久| 亚洲欧美日韩精品久久久久| 国产精品视频线看| 国产精品午夜免费| 欧美国产精品一区二区三区| 久久久青草青青国产亚洲免观| 久久久亚洲欧洲日产国码αv| 337p粉嫩大胆噜噜噜噜噜91av| 精品国产电影一区二区| 亚洲精品一线二线三线| 久久精品在线观看| 国产欧美日韩精品在线| 国产精品久99| 一区二区三区四区乱视频| 亚洲二区在线观看| 日韩精品乱码免费| 久久国产乱子精品免费女| 国产在线精品不卡| 成人久久久精品乱码一区二区三区 | 在线日韩国产精品| 欧美疯狂做受xxxx富婆| 日韩欧美在线综合网| 国产亚洲欧美色| 亚洲欧美偷拍三级| 亚洲一本大道在线| 日本人妖一区二区| 国产iv一区二区三区| 91在线观看一区二区| 欧美老年两性高潮| 欧美激情自拍偷拍| 亚洲最大成人网4388xx| 日韩专区欧美专区| 国产精品 日产精品 欧美精品| av亚洲精华国产精华精华| 欧美日韩国产123区| 国产欧美精品一区二区三区四区| 一区二区三区欧美在线观看| 久久99精品国产麻豆婷婷| 99精品视频中文字幕| 日韩一区二区免费电影| 亚洲欧美怡红院| 老鸭窝一区二区久久精品| 北条麻妃国产九九精品视频| 欧美日本韩国一区二区三区视频|