国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

蔚來智駕芯片神璣NX9031開啟“賺錢”模式 已向一公司提供技術(shù)授權(quán)東風(fēng)汽車布局低空技術(shù),首臺馬赫動力2.0T飛行發(fā)動機(jī)交付華為“碰一碰”新專利公布:重塑內(nèi)容分享模式 引領(lǐng)設(shè)備交互新范式級數(shù)AI與阿里云達(dá)成全棧AI戰(zhàn)略合作奇瑞風(fēng)云 T9L 官宣 2025 廣州車展首發(fā)亮相諾基亞公布全新戰(zhàn)略:聚焦 AI 驅(qū)動的網(wǎng)絡(luò)變革,整合為兩大核心業(yè)務(wù)板塊夸克 AI 眼鏡與支付寶合作升級,新增骨傳導(dǎo)拾音、準(zhǔn)心等獨家能力東軟云科技入選福布斯中國“2025出海全球化領(lǐng)軍品牌TOP30”11月24日榮耀500系列發(fā)布 來京東1元鎖定“龍馬金繩”真金禮盒同款iPad Air京東比Apple官方便宜上千元 全國可用的政府補(bǔ)貼真香縱橫G700迪拜上市:中國豪華越野的全球奢享宣言華為Mate X7今日開啟預(yù)訂 搭載第二代紅楓影像等配置百度Q3 AI收入96億元同比增50%,蘿卜快跑出行量翻倍榮耀500全系搭載驍龍8系旗艦芯華為MatePad Edge首次實現(xiàn)平板、電腦深度融合:四指橫滑無縫切換千問登場,阿里瞄準(zhǔn)C端關(guān)鍵一戰(zhàn)“雙十一”履約時效“卷”至分鐘級,順豐同城全場景全渠道單量顯著增長工信部:到2027年,建成200個左右高標(biāo)準(zhǔn)數(shù)字園區(qū)飛利浦Evnia弈威推27M2N6501L顯示器:27" QHD 240Hz QD-OLEDQuestMobile2025年雙十一洞察報告:平臺間用戶爭奪戰(zhàn)激烈
  • 首頁 > 云計算頻道 > 大模型

    「有效上下文」提升20倍!DeepMind發(fā)布ReadAgent框架

    2024年04月07日 11:13:37 來源:新智元公眾號

      基于Transformer的大語言模型(LLM)具有很強(qiáng)的語言理解能力,但LLM一次能夠讀取的文本量仍然受到極大限制。

      除了上下文窗口較小外,LLM的性能會隨著輸入內(nèi)容長度的增加而下降,即便輸入內(nèi)容未超過模型的上下文窗口長度限制也是如此。

      相比之下,人類卻可以閱讀、理解和推理很長的文本。

      LLM和人類在閱讀長度上存在差異的主要原因在于閱讀方法:LLM逐字地輸入精確的內(nèi)容,并且該過程相對被動;但過于準(zhǔn)確的信息往往會被遺忘,而閱讀過程更注重理解模糊的要點信息,即不考慮準(zhǔn)確單詞的內(nèi)容能記憶更長時間。

      人類閱讀也是一個互動的過程,比如回答問題時還需要從原文中進(jìn)行檢索。

      為了解決這些限制,來自Google DeepMind和Google Research的研究人員提出了一個全新的LLM系統(tǒng)ReadAgent,受人類如何交互式閱讀長文檔的啟發(fā),將有效上下文長度增加了20倍。

      論文鏈接:https://arxiv.org/abs/2402.09727

      受人類交互式閱讀長文檔的啟發(fā),研究人員將ReadAgent實現(xiàn)為一個簡單的提示系統(tǒng),使用LLMs的高級語言功能:

      1. 決定將哪些內(nèi)容存儲在記憶片段(memory episode)中;

      2. 將記憶片段壓縮成稱為要點記憶的簡短片段記憶,

      3. 如果ReadAgent需要提醒自己完成任務(wù)的相關(guān)細(xì)節(jié),則采取行動(action)來查找原始文本中的段落。

      在實驗評估中,相比檢索、原始長上下文、要點記憶(gist memories)方法,ReadAgent在三個長文檔閱讀理解任務(wù)(QuALITY,NarrativeQA和QMSum)上的性能表現(xiàn)都優(yōu)于基線,同時將有效上下文窗口擴(kuò)展了3-20倍。

      ReadAgent框架

      1. 要點記憶(gist memory)

      要點記憶是原始長上下文中文本塊的短要點的有序集合,構(gòu)建gist記憶有兩個步驟:分頁(pagination)和記憶提要(memory gisting)。

      片段分頁(episode pagination)

      當(dāng)ReadAgent閱讀長文本時,通過選擇暫停閱讀的位置來決定在記憶片段中存儲哪些內(nèi)容。

      每一步都會為LLM提供部分文本,從上一個暫停點開始,并在達(dá)到最大單詞數(shù)限制時結(jié)束;提示LLM選擇段落之間的哪個點將是自然的暫停點,然后將前一個和當(dāng)前暫停點之間的內(nèi)容視為一個episode,也可以叫做頁(page)。

      記憶提要(memory gisting)

      對于每一頁,提示LLM將確切的內(nèi)容縮短為要點或摘要。

      2. 并行和順序交互查找

      由于要點記憶與頁相關(guān),所以只需提示LLM來找出哪一頁更像是答案,并在給定特定任務(wù)的情況下再次閱讀,主要有兩種查找策略:同時并行查找所有頁面(ReadAgent-P)和每次查找一個頁面(ReadAgent-S)。

      ReadAgent-P

      比如說,在問答任務(wù)中,通常會給LLM輸入一個可以查找的最大頁數(shù),但也會指示其使用盡可能少的頁面,以避免不必要的計算開銷和干擾信息(distracting information)。

      ReadAgent-S

      順序查找策略中,模型一次請求一頁,在決定展開(expand)哪個頁面之前,先查看之前展開過的頁面,從而使模型能夠訪問比并行查找更多的信息,預(yù)期在某些特殊情況下表現(xiàn)得更好。

      但與模型的交互次數(shù)越多,其計算成本也越高。

      3. 計算開銷和可擴(kuò)展性

      片段分頁、記憶提要和交互式查找需要迭代推理,也存在潛在的計算開銷,但具體開銷由一個小因子線性約束,使得該方法的計算開銷不會輸入長度的增加而劇烈提升。

      由于查找和響應(yīng)大多是條件要點(conditioned gists)而非全文,所以在同一上下文中的任務(wù)越多,成本也就越低。

      4. ReadAgent變體

      當(dāng)使用長文本時,用戶可能會提前知道要解決的任務(wù):在這種情況下,提要步驟可以在提示中包括任務(wù)描述,使得LLM可以更好地壓縮與任務(wù)無關(guān)的信息,從而提高效率并減少干擾信息,即條件ReadAgent

      更通用的任務(wù)設(shè)置下,在準(zhǔn)備提要時可能不知道具體任務(wù),或者可能知道提出的要點需要用于多個不同的任務(wù),例如回答關(guān)于文本的問題等。

      因此,通過排除注冊步驟中的任務(wù),LLM可以產(chǎn)生更廣泛有用的提要,代價是減少壓縮和增加干擾注意力的信息,即非條件ReadAgent。

      這篇論文中只探討了無條件設(shè)置,但在某些情況下,條件設(shè)置可能更有優(yōu)勢。

      迭代提要(iterative gisting)

      對于一段很長的事件歷史,例如對話等,可以考慮通過迭代提要來進(jìn)一步壓縮舊記憶來實現(xiàn)更長的上下文,對應(yīng)于人類的話,舊記憶更模糊。

      實驗結(jié)果

      研究人員評估了ReadAgent在三個長上下文問答挑戰(zhàn)中的長文檔閱讀理解能力:QuALITY、NarrativeQA和QMSum。

      雖然ReadAgent不需要訓(xùn)練,但研究人員仍然選擇在訓(xùn)練集上開發(fā)了一個模型并在驗證、測試和/或開發(fā)集上進(jìn)行了測試,以避免過擬合系統(tǒng)超參數(shù)的風(fēng)險。

      選用的模型為指令微調(diào)后的PaLM 2-L模型。

      評估指標(biāo)為壓縮率(compression rate, CR),計算方法如下:

      LLM評分器

      NarrativeQA和QMSum都有一個或多個自由形式的參考回復(fù),通常使用諸如ROUGE-F之類的語法匹配度量來評估。

      除此之外,研究人員使用自動LLM評分器來評估這些數(shù)據(jù)集,作為人工評估的替代方法。

      上面兩個提示中,「嚴(yán)格LLM評分器提示」用于判斷是否存在精確匹配,「許可LLM評分器提示」用于判斷是否存在精確匹配或部分匹配。

      基于此,研究人員提出了兩個評價指標(biāo):LLM-Rating-1(LR-1)是一個嚴(yán)格的評估分?jǐn)?shù),計算所有示例中精確匹配的百分比;LLM-Rating-2(LR-2)計算精確匹配和部分匹配的百分比。

      長上下文閱讀理解

      QuALITY

      QuALITY是一個多選問答任務(wù),每個問題包含四個答案,使用來自多個不同來源的文本數(shù)據(jù)。

      實驗結(jié)果顯示,ReadAgent(查找1-5頁)實現(xiàn)了最好的結(jié)果,壓縮率為66.97%(即提要后上下文窗口中可以容納3倍的token)。

      當(dāng)增加允許查找的最大頁數(shù)(最多5頁)時,性能會不斷提高;在6頁時,性能開始略有下降,即6頁上下文可能會增加干擾信息。

      NarrativeQA

      在三個閱讀理解數(shù)據(jù)集中,NarrativeQA的平均上下文長度最長,為了將gists放入上下文窗口,需要擴(kuò)展頁面的尺寸大小。

      提要對Gutenburg文本(書籍)的壓縮率為96.80%,對電影劇本的壓縮率為91.98%

      QMSum

      QMSum由各種主題的會議記錄以及相關(guān)問題或說明組成,長度從1,000字到26,300字不等,平均長度約為10,000字,其答案是自由形式的文本,標(biāo)準(zhǔn)的評估指標(biāo)是ROUGE-F

      可以看到性能隨著壓縮率的降低而提高,因此查找更多頁面的技術(shù)往往比查找更少頁面的技術(shù)做得更好。

      還可以看到ReadAgentS大大優(yōu)于ReadAgent-P(以及所有基線),性能改進(jìn)的代價是檢索階段的請求數(shù)量增加了六倍。

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。

    海報生成中...

    最新新聞

    熱門新聞

    即時

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場占比高達(dá)35.8%,阿里云引領(lǐng)中國AI云增長

    9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    国产成人亚洲精品青草天美| 亚洲精品一区二区三区影院| 亚洲精品国产无天堂网2021 | 国产精品色呦呦| 色综合久久中文综合久久牛| 国产精品456| 在线电影国产精品| 国产精品免费免费| 成人免费看的视频| 色先锋资源久久综合| 国产一区二区h| 国产欧美精品一区二区色综合朱莉| 成人高清av在线| 久久国产综合精品| 中文字幕视频一区| 日韩精品成人一区二区在线| 92国产精品观看| 国产精品麻豆视频| 91精品国产综合久久久久| 图片区小说区国产精品视频| 久久久久97国产精华液好用吗| 欧洲一区在线电影| 国产99一区视频免费| 午夜成人免费视频| 亚洲欧美福利一区二区| 91视频免费看| 日韩成人一级大片| 欧美日韩久久一区二区| 国产裸体歌舞团一区二区| 99久久精品一区二区| 色哟哟欧美精品| 日韩一区二区三区高清免费看看| 欧美成人综合网站| 天堂成人国产精品一区| 亚洲第一二三四区| 午夜精品在线看| 韩国三级在线一区| 99久久久久久99| 欧美精品三级日韩久久| 波多野结衣的一区二区三区| 精品卡一卡二卡三卡四在线| 亚洲乱码国产乱码精品精的特点| 偷拍自拍另类欧美| 国产精品夜夜嗨| 色伊人久久综合中文字幕| 亚洲高清视频的网址| 国产精品污www在线观看| 国产99久久久久| 亚洲精品一区二区三区四区高清 | 五月婷婷综合在线| 亚洲免费观看高清完整版在线观看 | 色婷婷久久综合| 亚洲一区在线视频| 亚洲精品视频免费看| 欧美日韩精品一区二区| 蜜桃一区二区三区在线观看| 中文字幕精品三区| 在线免费视频一区二区| 奇米色一区二区| 亚洲国产精品国自产拍av| 麻豆成人久久精品二区三区小说| 日韩一二三区视频| 欧美在线视频日韩| 丝袜亚洲另类丝袜在线| 久久久国产精品麻豆| 91国产丝袜在线播放| 欧美日韩精品专区| 亚洲成人7777| 国产无人区一区二区三区| 91浏览器在线视频| 美女高潮久久久| 亚洲国产视频一区| 精品国产伦一区二区三区观看方式| 欧美中文字幕不卡| 99国产精品国产精品久久| 久久99精品国产.久久久久| 中文字幕亚洲不卡| 久久婷婷成人综合色| 6080国产精品一区二区| 在线区一区二视频| www.亚洲国产| 国产91富婆露脸刺激对白| 美女网站一区二区| 亚洲成人1区2区| 一区二区三区波多野结衣在线观看| 国产精品网站导航| 91精品国产一区二区三区香蕉| 99久久久精品| 91丨九色丨尤物| 91免费观看视频在线| 91在线观看地址| 国产91在线观看丝袜| 国产专区综合网| 日本欧美大码aⅴ在线播放| 偷窥国产亚洲免费视频| 亚洲.国产.中文慕字在线| 亚洲乱码精品一二三四区日韩在线| 久久精品欧美日韩| 在线视频综合导航| 91官网在线免费观看| 99精品视频一区二区| av在线不卡电影| 成人综合婷婷国产精品久久免费| 国产一区欧美日韩| 精品一区二区在线免费观看| 激情图片小说一区| 久久66热re国产| 狠狠网亚洲精品| 亚洲综合丝袜美腿| 丝袜亚洲另类欧美综合| 青草国产精品久久久久久| 婷婷国产在线综合| 国产精品国产三级国产aⅴ入口| 国产精品乱码一区二区三区软件| 国产精品福利一区| 一个色妞综合视频在线观看| 亚洲一区二区三区四区五区黄| 亚洲mv大片欧洲mv大片精品| 亚洲欧美日韩中文播放| 日韩一卡二卡三卡| 午夜视黄欧洲亚洲| 首页国产丝袜综合| 国产一区久久久| 不卡的av在线| 97久久精品人人爽人人爽蜜臀| 欧美午夜寂寞影院| 欧美日韩一区二区不卡| 亚洲免费三区一区二区| 日韩av午夜在线观看| 福利电影一区二区| 色噜噜夜夜夜综合网| 日韩精品一区二区三区视频播放 | 亚洲精品国产无天堂网2021| 亚洲女人的天堂| 国产视频一区二区三区在线观看| 亚洲h精品动漫在线观看| 欧美色欧美亚洲另类二区| 日产欧产美韩系列久久99| 久久亚洲春色中文字幕久久久| 欧美一级夜夜爽| 亚洲在线中文字幕| 久久av资源网| 欧美在线免费视屏| 国产精品女同互慰在线看| 视频一区视频二区中文| 欧美在线观看禁18| **网站欧美大片在线观看| 91官网在线观看| 麻豆精品久久久| 国产精品一区二区久久不卡| 欧美日韩三级在线| 国产欧美日韩在线看| 国产91丝袜在线观看| 久久婷婷国产综合精品青草| 性做久久久久久久免费看| 亚洲激情自拍偷拍| 在线精品视频一区二区三四| 久久久久久黄色| 国产精品一二三四区| 国产精品久久久久久久久晋中| 国产精品综合在线视频| 日本一区二区三区在线不卡| 麻豆中文一区二区| 中文字幕一区二区三区乱码在线 | 99免费精品在线| 欧美视频在线一区二区三区| 亚洲女同一区二区| 欧美理论在线播放| 国产精品自在欧美一区| 久久色在线视频| 一区二区三区中文字幕电影| 色综合久久久久久久久久久| 日本成人在线看| 综合网在线视频| 欧美日韩国产123区| 久久99久久久欧美国产| 午夜精品久久久久久久99水蜜桃| 91精品国产综合久久精品麻豆| 国产乱色国产精品免费视频| 91在线精品一区二区三区| 亚洲成人动漫在线观看| 一区二区激情视频| 亚洲欧美色一区| 一级精品视频在线观看宜春院| 色婷婷久久久久swag精品| 中文字幕五月欧美| 日韩影院精彩在线| 欧美国产欧美综合| 国产精品伊人色| 久久久久久久久免费| 日韩国产欧美在线视频| 精品免费国产二区三区| 国产成人午夜视频| 久久综合给合久久狠狠狠97色69| 国产精品成人一区二区三区夜夜夜 | 成人午夜免费av| 亚洲精品国产一区二区精华液 | 亚洲精品精品亚洲| 成人午夜在线免费| 乱一区二区av|