国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

  • 首頁 > 云計算頻道 > 大模型

    谷歌蘋果最新發現:LLM知道但不告訴你,掌握知識比表現出來的多

    2024年10月21日 09:30:20 來源:新智元導讀

      【新智元導讀】近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的要多得多!這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

      大模型的應用歷來受幻覺所擾。

      這個幻覺可以指代LLM產生的任何類型的錯誤:事實不準確、偏見、常識推理失敗等等。

      ——是因為大模型學半天白學了嗎?并不是。

      近日,來自谷歌和蘋果的研究表明:AI模型掌握的知識比表現出來的更多!

    論文地址:https://arxiv.org/pdf/2410.02707

      論文地址:https://arxiv.org/pdf/2410.02707

      研究人員在LLM內部表示上訓練分類器,以預測與生成輸出的真實性相關的各種特征。

      結果表明LLM的內部狀態編碼反映出的真實性信息,比以前認識到的要多得多。

      這些真實性信息集中在特定的token中,利用這一屬性可以顯著提高檢測LLM錯誤輸出的能力。

      雖說這種錯誤檢測無法在數據集中泛化,但好處是,模型的內部表示可用于預測模型可能犯的錯誤類型,從而幫助我們制定緩解錯誤的策略。

      研究揭示了LLM內部編碼和外部行為之間的差異:可能編碼了正確的答案,卻生成了不正確的答案。

      ——簡單來說就是,LLM它知道,但它不想告訴你!

      LLM在裝傻

      作者建議將重點從以人類為中心的幻覺解釋轉移到以模型為中心的視角,檢查模型的中間激活。

      不同于使用RAG或者依賴更強大的LLM judge,本文工作的重點是僅依賴于模型輸出的logits、softmax后的概率和隱藏狀態的計算。

      錯誤檢測器

      第一步是確定真實性信號在LLM中的編碼位置。

      假設我們可以訪問LLM的內部狀態(白盒),但不能訪問任何外部資源(搜索引擎或其他LLM)。

      建立一個數據集D,由N個問題標簽對組成,對于每個問題,提示模型生成響應,從而得到一組預測答案。

      接下來,比較LLM生成的回答與正確答案,從而構建錯誤檢測數據集(這一部可由AI代勞)。

      實驗選擇了四個LLM:Mistral-7b,Mistral-7b-instruct-v0.2,Llama3-8b和Llama3-8b-instruct。

      作者選取了10個跨越不同領域和任務的數據集:TriviaQA、HotpotQA(with/without context)、Natural Questions、Winobias、Winogrande、MNLI、Math、IMDB review sentiment analysis和另一個自制的電影角色數據集。

      實驗允許無限制地生成響應以模擬現實世界LLM的用法,并貪婪地解碼答案。

      性能指標

      測量ROC曲線下面積以評估錯誤檢測器,這能夠反映模型在多個閾值中區分陽性和陰性情況的能力,平衡靈敏度(真陽性率)和特異性(假陽性率)。

      錯誤檢測方法

      Majority:始終預測訓練數據中最頻繁的標簽。

      聚合概率/logits:從之前的研究中選取幾種方法,包括計算這些值的最小值、最大值或平均值。

      P(True):通過提示要求LLM評估其生成的正確性時。

      Probing:在模型的中間激活上訓練一個小分類器,以預測已處理文本的特征,這里使用線性探測分類器對靜態token進行錯誤檢測。

      作者認為,現有方法忽略了一個關鍵的細節:用于錯誤檢測token的選擇。

      研究者通常只關注最后生成的token或取平均值,然而,由于LLM一般會生成長格式響應,這種做法可能會錯過重要的部分。

      本文中,作者關注表示確切答案的token(EXACT ANSWER TOKENS),它代表了生成的響應中最有意義的部分。

      這里將EXACT ANSWER TOKENS定義為,如果修改則會改變答案正確性的token。

      實踐中,作者使用設置好的instruct模型代勞,來提取確切答案。之后,通過簡單的搜索過程確定對應的token。

      重點關注4個特定token:第一個確切答案的token及其前一個token、最后一個確切答案token及其后一個token。

      作者廣泛分析了層和token選擇對分類器的激活提取的影響,通過系統地探測模型的所有層,從最后一個問題token開始,一直到最終生成的token。

      上圖顯示了Mistral-7b-Struct中各個層和token關于探測的AUC指標。雖然一些數據集似乎更容易進行錯誤預測,但所有數據集都表現出一致的真實性編碼模式,中后期層通常會產生最有效的探測結果。

      通過比較使用和不使用EXACT ANSWER TOKENS的性能,來評估各種錯誤檢測方法,上表展示了三個代表性數據集上的AUC。

      不同任務中的泛化

      了解錯誤檢測器在不同任務中的泛化能力,對于實際應用程序至關重要。

      上圖(a)顯示了Mistral-7b-instruct的泛化結果,大于0.5的值表示泛化成功。乍一看,大多數熱圖值超過了0.5,似乎任務之間存在一定程度的泛化。

      然而事實上,大部分性能可以通過基于logit的真度檢測來實現。圖(b)顯示了從最強的基于Logit的基線(Logit-min-exact)中減去結果后的相同熱圖。

      這表示檢測器的泛化程度很少超過僅依賴Logit所能達到的效果。所以,泛化并不源于真實性的內部編碼,而是反映了已經通過logits等外部特征訪問的信息。

      經過訓練的探測分類器可以預測錯誤,但其泛化能力只發生在需要相似技能的任務(如事實檢索)中。

      對于涉及不同技能的任務,例如情感分析,探測分類器與基于logit的不確定性預測器效果差不多。

      錯誤類型研究

      在確定了錯誤檢測的局限性,并研究了不同任務的錯誤編碼有何不同之后,作者深入研究了單個任務中的錯誤,根據模型對重復樣本的響應對其錯誤進行分類。

      比如,持續生成的相同錯誤與偶爾生成的錯誤屬于不同類別。

      研究人員在T = 30的溫度設置下,對數據集中的每個樣本進行采樣,然后分析答案的結果分布。

      上圖展示了三種代表性的錯誤類型:

      圖(4a)中,模型通常會給出正確的答案,但偶爾會出錯,這意味著存在正確的信息,但采樣可能會導致錯誤。

      圖(4b)中,模型經常犯同樣的錯誤,但仍保留了一些知識。

      圖(4c)中,模型生成了大量錯誤的答案,整體置信度較低。

      分類的標準有三個:生成的不同答案的數量,正確答案的頻率,以及最常見的錯誤答案的頻率。

      上表顯示了所有模型的測試集結果。結果表明,可以從貪婪解碼的中間表示中預測錯誤類型。

      檢測正確答案

      模型的這種內部真實性如何在響應生成過程中與其外部行為保持一致?

      作者使用經過錯誤檢測訓練的探測器,從同一問題的30個響應中選擇一個答案,根據所選答案衡量模型的準確性。

      如果這種準確性與傳統解碼方法(如貪婪解碼)沒有顯著差異,則表明LLM的真實性內部表示與其外部行為一致。

      實驗在TriviaQA、Winobias和Math上進行,選擇probe評估的正確性概率最高的答案。這里比較了三個基線:貪婪解碼;從30個候選答案中隨機選擇;選擇生成的最頻繁的答案。

      結果如上圖所示,總體而言,使用探針選擇答案可以提高LLM所有檢查任務的準確性。但是,改進的程度因錯誤類型而異。

      探針可以有效地識別正確答案的事實表明,LLM的內部編碼與其外部行為之間存在重大脫節:即使模型編碼了哪個答案是正確的信息,它在實踐中仍然可能生成錯誤的答案。

      文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創作社區回歸!海藝AI國內首發“全民娛樂化創作

    海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。

    新聞

    市場占比高達35.8%,阿里云引領中國AI云增長

    9月9日,國際權威市場調研機構英富曼(Omdia)發布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    企業IT

    華為坤靈發布IdeaHub千行百業體驗官計劃,助力中小企

    9月24日,華為坤靈召開“智能體驗,一屏到位”華為IdeaHub千行百業體驗官計劃發布會。

    3C消費

    雅馬哈推出兩款高端頭戴耳機YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機,分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機器人出貨量同比暴

    IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    正在播放亚洲一区| 26uuu亚洲| 欧美欧美欧美欧美首页| 日韩限制级电影在线观看| 久久蜜桃香蕉精品一区二区三区| 国产农村妇女精品| 亚洲综合在线视频| 美女一区二区在线观看| 国产不卡免费视频| 欧美伊人精品成人久久综合97| 日韩欧美国产成人一区二区| 国产精品久久久久永久免费观看| 亚洲va中文字幕| 国产一区欧美日韩| 在线观看成人小视频| 欧美va天堂va视频va在线| 亚洲素人一区二区| 麻豆精品视频在线观看免费| 99精品热视频| 日韩欧美不卡在线观看视频| 亚洲欧美日韩中文字幕一区二区三区 | 欧美群妇大交群中文字幕| 久久久高清一区二区三区| 一区二区三区精品视频在线| 国内精品不卡在线| 欧美性videosxxxxx| 久久精品视频一区二区三区| 午夜精品一区二区三区电影天堂| 国产91在线观看| 日韩一区二区在线看| 亚洲另类在线视频| 国产精品一区二区不卡| 欧美人伦禁忌dvd放荡欲情| 国产精品久线在线观看| 精品一区二区三区久久| 欧美午夜精品久久久久久超碰| 久久精品视频在线免费观看| 日韩经典中文字幕一区| 色天天综合久久久久综合片| 国产日产亚洲精品系列| 蓝色福利精品导航| 欧美日韩国产高清一区| 1000部国产精品成人观看| 国产精品一区二区91| 91麻豆精品国产91久久久久久| 亚洲欧美一区二区三区久本道91 | 国产精品系列在线| 久久机这里只有精品| 欧美视频一区二区三区在线观看| 国产精品你懂的| 国产精品一区二区黑丝| 欧美变态凌虐bdsm| 日韩精品欧美精品| 欧美日韩综合在线免费观看| 亚洲免费观看高清完整| 成人av免费在线| 国产欧美日韩在线看| 国产专区欧美精品| 欧美第一区第二区| 奇米一区二区三区| 5566中文字幕一区二区电影| 亚洲国产美女搞黄色| 色婷婷久久久综合中文字幕| 国产精品久久午夜夜伦鲁鲁| 国产91在线观看丝袜| 久久久久成人黄色影片| 激情五月婷婷综合| 精品欧美一区二区在线观看| 美女视频黄频大全不卡视频在线播放| 欧美另类一区二区三区| 亚洲午夜日本在线观看| 欧美图片一区二区三区| 亚洲一区在线电影| 欧美日韩视频专区在线播放| 亚洲国产日韩av| 欧美日韩黄色一区二区| 三级成人在线视频| 777色狠狠一区二区三区| 午夜av区久久| 91精品国产综合久久婷婷香蕉 | 成人三级在线视频| 国产精品成人网| 99久久国产综合精品麻豆| 国产精品第四页| 91香蕉国产在线观看软件| 亚洲青青青在线视频| 91福利精品视频| 污片在线观看一区二区| 在线综合视频播放| 久久国产精品99久久人人澡| 亚洲精品一区在线观看| 国产成人在线影院| 中文字幕在线视频一区| 91麻豆福利精品推荐| 亚洲综合久久久久| 欧美精品成人一区二区三区四区| 蜜桃久久精品一区二区| 久久亚洲欧美国产精品乐播| 岛国精品在线播放| 亚洲欧美另类小说视频| 欧美三级在线视频| 免费观看在线综合色| xnxx国产精品| kk眼镜猥琐国模调教系列一区二区| 亚洲日本va午夜在线电影| 欧美日韩一区视频| 精品一区二区三区在线观看国产| 久久精品一级爱片| 色噜噜狠狠成人网p站| 日韩专区中文字幕一区二区| 欧美精品一区二区三区视频| 成人国产精品视频| 亚洲综合一区二区| 日韩精品中文字幕在线不卡尤物| 国产suv精品一区二区6| 亚洲精品国产品国语在线app| 在线观看91av| 国产一区二区免费看| 亚洲欧洲日韩女同| 欧美电影在线免费观看| 国产福利一区二区| 亚洲综合视频网| 2019国产精品| 色婷婷久久久久swag精品| 免费成人性网站| 国产精品福利电影一区二区三区四区| 欧美日韩一区高清| 国产精品一区二区三区99| 亚洲一区视频在线| 久久久久97国产精华液好用吗| 91久久精品一区二区三区| 精品一区二区日韩| 亚洲理论在线观看| 337p粉嫩大胆色噜噜噜噜亚洲| 色综合久久久网| 国产在线精品免费av| 亚洲激情成人在线| 欧美精品一区二区在线观看| 色偷偷一区二区三区| 久久 天天综合| 一区二区三区免费在线观看| 久久综合中文字幕| 欧美天堂亚洲电影院在线播放| 国产一区二区在线视频| 亚洲综合久久av| 日本一区二区三区国色天香| 3atv在线一区二区三区| 99久久er热在这里只有精品66| 日本不卡不码高清免费观看| 亚洲同性同志一二三专区| 欧美电影免费观看完整版| 在线观看亚洲成人| 国产91精品一区二区麻豆亚洲| 肉肉av福利一精品导航| 亚洲日本丝袜连裤袜办公室| 久久综合久色欧美综合狠狠| 欧美日韩成人高清| 91伊人久久大香线蕉| 国产精品一区二区黑丝| 欧美aⅴ一区二区三区视频| 亚洲美女精品一区| 国产亚洲制服色| 日韩视频123| 欧美日韩精品一区二区天天拍小说 | 日韩视频中午一区| 欧美综合亚洲图片综合区| 丁香激情综合五月| 激情av综合网| 青青草91视频| 亚洲午夜一区二区| 亚洲欧美一区二区三区久本道91| 国产日韩欧美综合一区| 欧美大度的电影原声| 欧美日韩久久久久久| 日本黄色一区二区| 99久久精品国产毛片| 成人深夜在线观看| 国产成人亚洲精品狼色在线| 久久av老司机精品网站导航| 视频一区视频二区中文字幕| 亚洲图片欧美视频| 一区二区三区四区在线| 亚洲欧洲综合另类| 亚洲三级在线免费观看| 国产精品婷婷午夜在线观看| 久久综合丝袜日本网| 欧美成人video| 日韩欧美区一区二| 日韩一区二区在线免费观看| 91精品视频网| 欧美一区二区不卡视频| 69久久夜色精品国产69蝌蚪网| 欧美日韩精品一区二区在线播放| 欧美中文字幕不卡| 欧美综合在线视频| 欧美亚日韩国产aⅴ精品中极品| 91激情在线视频| 欧美天堂一区二区三区| 欧美日韩精品二区第二页| 欧美久久免费观看|