国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    OpenAI o1式思維鏈,開源模型也可以有,成功案例來了

    2024年09月18日 09:40:20 來源:機器之心公眾號

      北京時間9月13日午夜,OpenAI 發布了推理性能強大的 ο1系列模型。之后,各路研究者一直在嘗試挖掘 ο1卓越性能背后的技術并嘗試復現它。當然,OpenAI 也想了一些方法來抑制窺探,比如有多名用戶聲稱曾試圖誘導 ο1模型公布其思維過程,然后收到了 OpenAI 的封號威脅。

      盡管如此,不過三四天時間,就已經有研究者宣稱已經成功復現/開發出了與 ο1性能差不多的推理技術,并且還不止一個!

      Llamaberry:教會 AI 像聰明人一樣思考

      Llamaberry 的提出者是 Martin Bowling。他開發的項目包括 RAGMiner.dev 和 Replit;其中前者可以幫助用戶毫不費力地將網站轉換成 Markdown、XML 或 JSON 等格式以便 RAG 和 LLM 應用使用,而后者則是一個使用 AI 將想法變成代碼的項目。

      Llamaberry 的核心思路是使用思維鏈(CoT)來實現推理。這個名字自然源自代表 o1模型的 Strawberry(草莓)。

      HuggingFace地址:https://huggingface.co/spaces/martinbowling/Llamaberry

      什么是思維鏈?Bowling 在博客中打了個比方:「思維鏈推理就像是給 AI 一個筆記本來展示其工作過程。其中不僅僅是簡單地給出答案,而是會帶領我們經歷其思維過程。」

      Llamaberry 能教會 AI 透徹地思考,就像是一位人類專家攻克難題時那樣。

      具體來說,Llamaberry 是一個多輪思維鏈推理系統的實現,其基于運行在 Groq 上的 Llama3.170B 模型。

      多輪推理是關鍵

      多輪推理,顧名思義,就是讓模型在給出答案之前進行多步思考,而不是一步給出答案。打個比方,這就像是看一位大廚從備菜到完成擺盤一步步地完成一道精美菜肴,而不是直接微波加熱預制菜。

      舉個示例:

      第1輪:AI 先嘗試解決當前問題。

      第2輪:AI 回顧第一次嘗試并盡力改進或優化其思維過程。

      第3輪:再進行一輪反思和改進。

      綜合結果:最后,將所有這些思考綜合到一起,得到一個連貫且合理的答案。

      下面展示了這個多輪過程的示意圖:

      可以看到,前一輪的輸出會成為后一輪的輸入,從而讓 AI 可在每個階段不斷完善其思維。最后,所有這些思考會凝練成一個合理的最終答案。就像看著一枚莓果逐漸成熟!

      如何實現

      下面將深入 Llamaberry 的實現細節。

      1.設置舞臺

      首先,我們需要為 AI 助手設置一些基本規則,代碼如下:

      initial_system_prompt="""YouareanAIassistantcapableofdetailed,step-by-stepthinking.Whenpresentedwithaquestionorproblem,breakdownyourthoughtprocessintoclear,logicalsteps.Foreachstep,explainyourreasoning.Concludewithafinalanswer.Usethefollowingmarkdownstructure:

      這就是提供給 AI 大廚的菜譜。它知道需要逐步分解其思考過程并解釋每個步驟,并且以 Markdown 格式將它們顯示出來。

      2.思考過程

      在每一輪推理中,都需要讓 AI 對問題進行思考。但在第一輪結束后,還需要求它思考之前已經思考過的東西。這就像問朋友,「嘿,還記得你之前說過什么嗎?讓我們再想一想。」

      下面是每一輪的生成方式:

      asyncdefgenerate_turn(query:str,previous_turns:list=None)->str:

      該函數是多輪推理的核心。它決定我們是在第一輪還是在后續輪,并以此構建提示詞。對于后續輪,它會將之前所有推理輪都包含在上下文中,讓 AI 可以基于之前的思考進行構建。

      3.綜合結果

      經過三輪思考之后,再讓 AI 檢視其所有思考并得出一個合理的最終答案。這就像是讓專家討論問題,然后編寫最終報告。

      asyncdefsynthesize_turns(query:str,turns:list)->str:turns_text="\n\n".join([f"Turn{i+1}:\n{turn}"fori,turninenumerate(turns)])messages=[{"role":"system","content":synthesis_prompt},{"role":"user","content":f"OriginalQuery:{query}\n\nTurnsofReasoning:\n{turns_text}"}]returnawaitcall_llm(messages)

      這個綜合步驟至關重要,是 AI 綜合所有思考內容凝練出最終答案的一步。

      單輪推理 vs 多輪推理

      Martin Bowling 在其博客中簡單比較了單輪和多輪推理。

      這里他采用了一個簡單示例,即詢問 AI:「人工智能對就業市場有什么潛在影響?」

      單輪推理:

      AI:Artificialintelligencewilllikelyhavesignificantimpactsonthejobmarket,including:

      使用 Llamaberry 執行多輪推理:

      第1輪:

      AI:Let'sapproachthisstep-by-step:

      第2輪:

      AI:Let'srefineourthinking:

      第3輪:

      AI:Let'sdelvedeeper:

      綜合答案:

      AI:Aftercarefulconsiderationacrossmultipleturnsofreasoning,wecansynthesizeourthoughtsonthepotentialimpactsofartificialintelligenceonthejobmarket:

      可以看到,多輪方法能實現更加精細、全面的分析。這能從多個角度考慮問題,優化其思考,最后得到更加深思熟慮和全面詳細的答案。

      Bowling 表示,這樣的多輪推理在思考深度、自我提升、透明度、靈活性等方面都有巨大優勢,同時其還采用了 Markdown 格式,使其結果更容易閱讀和用于后續流程。

      因此,這種技術可讓 AI 進入更多實際應用場景,比如醫療診斷、法律分析、科學研究、商業策略、教育。當然,在使用 Llamaberry 等多輪推理系統時,也需要注意它們的局限和潛在的道德倫理問題,比如偏見、計算成本、過度依賴和隱私問題。

      如何使用 Llamaberry?

      Llamaberry 也很容易使用,點擊幾下就能擁有你自己的多輪推理系統。步驟如下:

      前往 Replit,點擊該鏈接獲取 Llamaberry 模板:https://replit.com/@MartinBowling/Llamaberry-Powered-By-Groq?v=1

      創建模板分支:點擊 Fork 按鈕創建你自己的 Llamaberry 項目副本。

      獲取你的 Groq API Key:注冊 Groq 賬戶,獲取 API Key。

      設置環境:在你的分支 Replit 項目中,找到「Secrets」選項卡。添加一個新密鑰,密鑰為 GROQ_API_KEY,值是你的 Groq API 密鑰。

      運行項目:單擊 Replit 界面頂部的 Run 按鈕。這將啟動 Llamaberry 應用。

      開始實驗:應用運行起來后,你將看到一個 Gradio 界面。你可以在其中輸入問題并查看 Llamaberry 多輪推理的實際效果!并且輸出是簡潔漂亮的 Markdown 格式!

      了解了 Llamaberry,下面來看另一個號稱實現了類 o1推理鏈的項目:g1。

      g1:實現類似 ο1的推理鏈

      g1這個項目來自 Benjamin Klieger,他是 Groq 的一位研究者。也因此,g1同樣基于 Groq,并且其也使用了 Llama3.170b 模型。

      不同于 Llamaberry 使用的多輪思維鏈推理,g1的策略是角色扮演、思維鏈提示 、格式化以及另一些提示技巧。并且,g1開源了。

      開發者宣稱 g1有70% 的時間能成功數出 Strawberry 中有多少個 R,同時無需任何微調或少樣本技術。下面是其一次執行過程:

      開發者 Klieger 表示,g1和 ο1一樣能讓 LLM 有能力「思考」和解決之前的領先模型難以應對的邏輯問題。但不同之處在于,g1會大方地展示所有推理 token。同時,他也強調了 g1和 ο1在技術上的差異,其中后者使用了大規模強化學習來執行思維鏈推理。而 g1則是通過發掘提示詞工程的潛力來幫助 LLM 解決簡單的邏輯問題,讓現有的開源模型也能受益于動態推理鏈和優化般的探索界面。

      g1的工作方式

      由 Llama3.170b 支持的 g1會創建一種動態的思維鏈。

      在每個步驟中,LLM 可以選擇是繼續進行另一個推理步驟,還是提供最終答案。每個步驟都有標題,并且對用戶可見。

      系統提示詞中還會包含給 LLM 的提示。其提示策略如下:

      YouareanexpertAIassistantthatexplainsyourreasoningstepbystep.Foreachstep,provideatitlethatdescribeswhatyou'redoinginthatstep,alongwiththecontent.Decideifyouneedanothersteporifyou'rereadytogivethefinalanswer.RespondinJSONformatwith'title','content',and'next_action'(either'continue'or'final_answer')keys.USEASMANYREASONINGSTEPSASPOSSIBLE.ATLEAST3.BEAWAREOFYOURLIMITATIONSASANLLMANDWHATYOUCANANDCANNOTDO.INYOURREASONING,INCLUDEEXPLORATIONOFALTERNATIVEANSWERS.CONSIDERYOUMAYBEWRONG,ANDIFYOUAREWRONGINYOURREASONING,WHEREITWOULDBE.FULLYTESTALLOTHERPOSSIBILITIES.YOUCANBEWRONG.WHENYOUSAYYOUARERE-EXAMINING,ACTUALLYRE-EXAMINE,ANDUSEANOTHERAPPROACHTODOSO.DONOTJUSTSAYYOUARERE-EXAMINING.USEATLEAST3METHO***ODERIVETHEANSWER.USEBESTPRACTICES.

      對這些提示詞的詳細解釋請參閱原項目的 Prompt Breakdown 一節。這里就不贅述了,僅給出幾個示例,比如可以在提示詞中加入「include exploration of alternative answers」(探索其它答案)和「use at least3methods to derive the answer」(使用至少三種方法來得出答案)。

      這樣一來,通過組合思維鏈以及嘗試多種方法、探索其它答案、質疑之前草擬的解答、考慮 LLM 的局限性等策略,就能顯著提升 LLM 的推理能力。

      在數 Strawberry 中有多少個 R 這個經典問題上,無需任何訓練,g1就能幫助 Llama3.170b 達到約70% 的準確度(n=10, How many Rs are in strawberry?)。而如果不使用提示技術,Llama3.170b 的準確率為0%,ChatGPT-4o 的也只有30%。

      下面展示了另一個示例:0.9和0.11哪個更大?

      詳細的安裝過程和代碼請參閱原項目。

      最后,順便一提,另有開發者發布了 g1的分支版 Mult1,該版本的一大改進是可使用多個 AI 提供商來創建類似 o1的推理鏈

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    日本不卡免费在线视频| 九九精品视频在线看| 欧美日韩另类一区| 99久久99久久精品国产片果冻 | 首页国产欧美日韩丝袜| 亚洲主播在线播放| 亚洲激情中文1区| 亚洲欧美日韩久久| 亚洲主播在线播放| 丝袜亚洲另类欧美| 另类中文字幕网| 国产精品66部| gogo大胆日本视频一区| 色婷婷精品大视频在线蜜桃视频| 日本高清不卡视频| 欧美高清性hdvideosex| 日韩女优av电影在线观看| 久久亚区不卡日本| 日韩美女久久久| 日韩在线播放一区二区| 精品一区二区三区久久| 成人免费毛片高清视频| 在线一区二区观看| 欧美日韩精品是欧美日韩精品| 欧美一区二区福利在线| 久久精品一区二区三区不卡牛牛| 国产精品传媒视频| 日韩中文字幕1| 国产高清无密码一区二区三区| 91网站黄www| 欧美一二三区在线观看| 国产精品五月天| 天天操天天色综合| 成人晚上爱看视频| 这里只有精品视频在线观看| 久久免费视频色| 一区2区3区在线看| 国产精品香蕉一区二区三区| 91黄色激情网站| 久久精品一区二区三区不卡| 亚洲一区二区中文在线| 国产麻豆精品久久一二三| 日本精品一级二级| 久久久影院官网| 性做久久久久久免费观看 | 亚洲欧美视频在线观看视频| 日韩av中文在线观看| 成人少妇影院yyyy| 欧美mv日韩mv亚洲| 亚洲网友自拍偷拍| 成人av在线资源网站| 日韩一级二级三级| 亚洲一区二区三区中文字幕在线| 国产九色sp调教91| 欧美一级高清片| 一区二区高清在线| av男人天堂一区| 久久精品欧美一区二区三区不卡 | www.欧美日韩国产在线| 欧美本精品男人aⅴ天堂| 有码一区二区三区| 不卡电影一区二区三区| 精品国产乱码久久久久久老虎| 亚洲网友自拍偷拍| 91在线观看成人| 国产精品久久久久久久第一福利 | 日韩美女视频一区二区在线观看| 亚洲一区免费观看| 色婷婷狠狠综合| 亚洲免费视频中文字幕| 波多野结衣视频一区| 国产日韩欧美综合一区| 精品影院一区二区久久久| 日韩一区二区三区观看| 日韩黄色片在线观看| 精品视频1区2区| 亚洲国产一二三| 精品视频全国免费看| 亚洲成人免费av| 欧美精选午夜久久久乱码6080| 洋洋av久久久久久久一区| 色网综合在线观看| 亚洲老司机在线| 欧美亚洲动漫精品| 午夜精品aaa| 日韩欧美综合在线| 国产一区二区精品在线观看| 久久久久久久久久久99999| 九一九一国产精品| 国产午夜精品一区二区三区嫩草| 国产福利一区二区三区视频 | 久久久青草青青国产亚洲免观| 精品一区二区在线视频| 精品电影一区二区三区| 国产精品一级二级三级| 欧美激情综合网| 成人精品鲁一区一区二区| 中日韩免费视频中文字幕| 91在线免费看| 亚洲成av人片一区二区梦乃| 日韩欧美成人激情| 成人激情开心网| 伊人一区二区三区| 欧美一级理论片| 国产成人精品免费一区二区| 亚洲婷婷国产精品电影人久久| 欧美在线制服丝袜| 久久er精品视频| 欧美高清在线精品一区| 色噜噜狠狠色综合中国| 日韩精品一级二级| 日本一区二区三区电影| 欧美性色欧美a在线播放| 精品午夜一区二区三区在线观看| 国产精品美女一区二区| 欧美日韩精品系列| 懂色av一区二区夜夜嗨| 亚洲第一主播视频| 久久九九影视网| 欧美三级三级三级爽爽爽| 久久激情五月激情| 亚洲乱码国产乱码精品精小说| 日韩视频一区在线观看| 99久久国产免费看| 日本视频一区二区三区| 国产精品久久三| 欧美肥妇bbw| 99国产精品国产精品毛片| 蜜桃精品视频在线| 一区二区三区91| 国产欧美一区二区三区在线看蜜臀 | 99精品热视频| 免费欧美在线视频| 亚洲视频一区在线| 久久久久久久久久久久久久久99 | 91猫先生在线| 国产一区91精品张津瑜| 伊人性伊人情综合网| 久久精品亚洲麻豆av一区二区 | 69av一区二区三区| av电影在线不卡| 国产综合成人久久大片91| 一区二区三区免费网站| 国产精品色哟哟网站| 久久综合久久综合九色| 91精品国产综合久久精品| 欧美中文字幕一区| 91蜜桃在线观看| 成人午夜短视频| 国产高清精品在线| 久久99最新地址| 日本aⅴ亚洲精品中文乱码| 亚洲免费在线观看视频| 日本一区二区三区久久久久久久久不| 日韩欧美综合在线| 欧美一区二区在线不卡| 欧美日韩中文一区| 欧美视频一区二区三区在线观看| 91啪在线观看| 一本久道久久综合中文字幕| 成人h动漫精品| www.日本不卡| 91首页免费视频| 91黄色在线观看| 欧美亚一区二区| 欧美亚洲一区二区三区四区| 色视频成人在线观看免| 在线免费观看成人短视频| 91福利视频网站| 欧美年轻男男videosbes| 欧美精选一区二区| 91精品国产乱码久久蜜臀| 日韩欧美中文字幕公布| 亚洲精品一区二区三区香蕉| 久久欧美中文字幕| 日本一区二区成人在线| 中文字幕精品一区二区三区精品| 国产精品久久毛片| 亚洲欧美区自拍先锋| 亚洲狠狠爱一区二区三区| 日韩精品成人一区二区在线| 久久精品国产亚洲a| 激情欧美一区二区| 成人黄色777网| 91福利精品第一导航| 91麻豆精品国产91久久久久 | 欧美日韩国产成人在线91| 欧美日韩和欧美的一区二区| 91精品国产高清一区二区三区蜜臀| 日韩欧美一二三区| 久久久国产精品午夜一区ai换脸| 国产免费久久精品| 亚洲精品日韩综合观看成人91| 亚洲电影第三页| 国产乱人伦偷精品视频不卡| 一本色道久久加勒比精品| 日韩午夜中文字幕| 国产精品毛片a∨一区二区三区| 一区二区欧美精品| 精品一区二区三区免费毛片爱|