国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院

長安品牌正式進(jìn)入印度尼西亞,“海納百川”駛?cè)肴f島之國全新品牌”奕境”正式發(fā)布,重構(gòu)智慧新能源市場格局搭載地平線HSD,深藍(lán)L06城區(qū)輔助駕駛體驗(yàn)趕超特斯拉FSD寒冬突圍,廚電第二增長曲線亟待夯實(shí)東南亞智能手機(jī)出貨量繼續(xù)下滑 小米以430萬部位居第三華為萬元機(jī)皇 Mate 80 RS全系玻璃材質(zhì):無緣陶瓷字節(jié)最新估值直沖5000億美元,收入已連續(xù)兩季超越Meta消息稱抖音電商 GMV 將突破 4 萬億,本地生活增速近 60%京東京造文具將首登2025 Paperworld China中國國際文具展 帶來專屬優(yōu)惠、創(chuàng)新展品唯品會2025年第三季度凈營收同比增3.4%,活躍用戶數(shù)同比正增長復(fù)興島科創(chuàng)孵化大會隆重舉行,世界級科技創(chuàng)新孵化集群驚艷亮相聚力元宇宙,賽出真功夫:2025金磚大賽之元宇宙3D數(shù)字內(nèi)容設(shè)計(jì)創(chuàng)作賽項(xiàng)全國總決賽進(jìn)入備賽沖刺階段網(wǎng)易第三季度營收 284 億元同比增長 8.2%,凈利潤 86 億元資本賦能商業(yè)航天:讓技術(shù)優(yōu)勢實(shí)現(xiàn)商業(yè)價(jià)值海爾機(jī)器人與INDEMIND達(dá)成戰(zhàn)略合作,突破空間智能泛化難關(guān),共創(chuàng)家庭具身AI新生態(tài)TCL空調(diào)深耕 AI 健康技術(shù),引領(lǐng)行業(yè)品質(zhì)升級智能制造賦能,TCL空調(diào)以AI健康技術(shù)定義新一代空調(diào)長城坦克 300 極地版 SUV 明日亮相廣州車展并開啟預(yù)訂DEKRA德凱全新網(wǎng)絡(luò)安全評估實(shí)驗(yàn)室正式啟用,加速布局?jǐn)?shù)字信任服務(wù)亞馬遜云科技宣布Kiro正式可用
  • 首頁 > 云計(jì)算頻道 > 大模型

    研究發(fā)現(xiàn),GPT 和其他AI模型無法分析SEC備案文件

    2023年12月20日 20:17:09 來源:站長之家

      一家名為 Patronus AI 的初創(chuàng)公司的研究人員發(fā)現(xiàn),大型語言模型在分析美國證券交易委員會(SEC)備案文件時(shí)經(jīng)常無法正確回答問題。即使是表現(xiàn)最佳的人工智能模型配置 OpenAI 的GPT-4-Turbo,當(dāng)給予幾乎整個(gè)備案文件的閱讀能力和相關(guān)問題時(shí),僅有79% 的問題回答正確。Patronus AI 的創(chuàng)始人告訴 CNBC,這些所謂的大型語言模型有時(shí)會拒絕回答問題,或者會 “產(chǎn)生幻覺”,出現(xiàn)備案文件中不存在的數(shù)字和事實(shí)。

      Patronus AI 的聯(lián)合創(chuàng)始人 Anand Kannappan 表示:“這種性能水平完全不能接受。要想實(shí)現(xiàn)自動化和投入生產(chǎn)使用,性能必須更高。” 這些發(fā)現(xiàn)凸顯了 AI 模型在大公司中應(yīng)用的一些挑戰(zhàn),尤其是在金融等受監(jiān)管行業(yè)。這些公司希望將先進(jìn)技術(shù)應(yīng)用于客戶服務(wù)或研究,但 AI 模型面臨一些困難。

      快速提取重要數(shù)字并對財(cái)務(wù)陳述進(jìn)行分析被認(rèn)為是聊天機(jī)器人最有前景的應(yīng)用之一,自去年底發(fā)布 ChatGPT 以來一直備受關(guān)注。SEC 備案文件中充滿著重要的數(shù)據(jù),如果一個(gè)機(jī)器人能夠準(zhǔn)確地概括這些文件或快速回答相關(guān)問題,它可以使用戶在競爭激烈的金融行業(yè)中占據(jù)優(yōu)勢。

      在過去的一年里,彭博社開發(fā)了自己的金融數(shù)據(jù) AI 模型,商學(xué)院教授研究了 ChatGPT 是否可以解析財(cái)經(jīng)頭條新聞,摩根大通正在開發(fā)一個(gè)基于 AI 的自動投資工具。根據(jù) CNBC 之前的報(bào)道,生成式 AI 預(yù)計(jì)每年可以為銀行業(yè)帶來數(shù)萬億美元的收益。

      然而,GPT 進(jìn)入該行業(yè)并不順利。微軟首次推出使用 OpenAI 的 GPT 的必應(yīng)聊天時(shí),其主要示例之一是使用聊天機(jī)器人快速概述盈利新聞稿。觀察人員很快就意識到微軟示例中的數(shù)字是錯誤的,一些數(shù)字完全是虛構(gòu)的。

      Patronus AI 的聯(lián)合創(chuàng)始人表示,將大型語言模型應(yīng)用于實(shí)際產(chǎn)品的挑戰(zhàn)之一是,它們是非確定性的,不能保證每次給出相同的輸出。這意味著公司需要進(jìn)行更嚴(yán)格的測試,以確保它們的模型運(yùn)行正確,不會偏離主題,并提供可靠的結(jié)果。

      該公司的創(chuàng)始人在 Facebook 的母公司 Meta 公司相識,他們在該公司從事與理解模型生成答案的問題以及使其更加 “負(fù)責(zé)任” 方面的 AI 問題。他們成立了 Patronus AI,該公司已從 Lightspeed Venture Partners 獲得種子資金,旨在通過軟件實(shí)現(xiàn)對大型語言模型的自動化測試,以便公司可以確保其 AI 機(jī)器人不會以離題或錯誤的答案令客戶或員工感到驚訝。

      Patronus AI 致力于編寫一套由主要上市公司的 SEC 備案文件中提取的10,000多個(gè)問題和答案,該數(shù)據(jù)集被稱為 FinanceBench。數(shù)據(jù)集包括正確答案,以及在任何給定備案文件中準(zhǔn)確查找答案的位置。并非所有答案都可以直接從文本中提取,有些問題需要輕微的數(shù)學(xué)或推理。

      Patronus AI 測試了四個(gè)語言模型:OpenAI 的 GPT-4和 GPT-4-Turbo,Anthropic 的 Claude2和 Meta 的 Llama2,使用該公司生成的150個(gè)問題的子集進(jìn)行測試。他們還測試了不同的配置和提示方式,例如將 OpenAI 模型在問題中給出與答案相關(guān)的確切源文本的 “Oracle” 模式。在其他測試中,模型被告知底層 SEC 文件存儲的位置,或者在提示中包含 “長上下文”,即幾乎完整的 SEC 備案文件與問題一起提供。

      GPT-4-Turbo 在該公司的 “閉卷” 測試中失敗,該測試不允許其訪問任何 SEC 源文件。它在被問到的150個(gè)問題中,未能回答88% 的問題,只有14次給出了正確答案。當(dāng)獲得對底層備案文件的訪問權(quán)限時(shí),其性能有了顯著改善。在 “Oracle” 模式下,GPT-4-Turbo 在85% 的情況下正確回答問題,但仍然在15% 的情況下給出了錯誤答案。然而,這種測試方式并不現(xiàn)實(shí),因?yàn)樗枰斯ぽ斎胍哉业絺浒肝募写_切的相關(guān)位置,而這正是許多人希望語言模型能夠解決的問題。

      Meta 開發(fā)的開源 AI 模型 Llama2在獲得各種底層文件的訪問權(quán)限時(shí),產(chǎn)生了一些最糟糕的 “幻覺”,錯誤回答的比例高達(dá)70%,僅有19% 的回答正確。Anthropic 的 Claude2在提供 “長上下文” 的情況下表現(xiàn)良好,可以回答75% 的問題,21% 的回答錯誤,僅有3% 的問題未能回答。GPT-4-Turbo 在長上下文測試中表現(xiàn)也不錯,79% 的問題回答正確,17% 的回答錯誤。

      在進(jìn)行測試后,Patronus AI 的創(chuàng)始人對模型的表現(xiàn)感到驚訝,即使在指導(dǎo)答案所在位置的情況下,它們的表現(xiàn)仍然很差。“即使答案在上下文中,模型拒絕回答的頻率也非常高,而人類是可以回答的。”Qian 說道。然而,即使模型表現(xiàn)良好,仍然不夠好,Patronus AI 發(fā)現(xiàn)。“即使模型在20次中回答錯誤1次,這個(gè)錯誤率對于受監(jiān)管的行業(yè)來說仍然不可接受。”Qian 說道。

      然而,Patronus AI 的創(chuàng)始人認(rèn)為,像 GPT 這樣的語言模型在金融行業(yè)中有巨大的潛力,無論是分析師還是投資者,如果 AI 技術(shù)繼續(xù)改進(jìn)。“我們確實(shí)認(rèn)為結(jié)果可能非常有希望。”Kannappan 表示,“隨著時(shí)間的推移,模型將會變得更好。我們非常有希望在長期內(nèi),很多工作可以實(shí)現(xiàn)自動化。但是現(xiàn)在,你肯定需要至少一個(gè)人參與來支持和引導(dǎo)你的工作流程。”

      文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。

    海報(bào)生成中...

    最新新聞

    熱門新聞

    即時(shí)

    全球頂級AI創(chuàng)作社區(qū)回歸!海藝AI國內(nèi)首發(fā)“全民娛樂化創(chuàng)作

    海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計(jì)模型數(shù)超過80萬個(gè),涵蓋寫實(shí)、二次元、插畫、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。

    新聞

    市場占比高達(dá)35.8%,阿里云引領(lǐng)中國AI云增長

    9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報(bào)告。中國AI云市場阿里云占比8%位列第一。

    企業(yè)IT

    華為坤靈發(fā)布IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃,助力中小企

    9月24日,華為坤靈召開“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會。

    3C消費(fèi)

    雅馬哈推出兩款高端頭戴耳機(jī)YH-4000與YH-C3000

    雅馬哈昨日宣布推出兩款頭戴式耳機(jī),分別是平板振膜的YH-4000和動圈原理的YH-C3000。

    研究

    IDC:2025上半年全球智能家居清潔機(jī)器人出貨量同比暴

    IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。

    国产九九视频一区二区三区_亚洲欧美资源在线_精品国产自在久精品国产_成人午夜黄色影院
    18成人在线观看| 亚洲在线观看免费视频| 国产成a人亚洲| 国产一区在线观看麻豆| 麻豆国产精品一区二区三区| 午夜激情一区二区| 天堂久久一区二区三区| 婷婷成人激情在线网| 丝袜脚交一区二区| 全国精品久久少妇| 青青草国产精品亚洲专区无| 蜜臀av国产精品久久久久| 奇米精品一区二区三区在线观看一| 午夜精品久久久| 男女视频一区二区| 韩日欧美一区二区三区| 福利一区二区在线| 欧美一a一片一级一片| 欧美精品1区2区3区| 日韩免费高清av| 国产精品视频在线看| 亚洲精品国产a| 日韩电影在线一区| 国产高清不卡一区| 欧美中文一区二区三区| 欧美顶级少妇做爰| 久久久综合九色合综国产精品| 久久无码av三级| 亚洲人成网站在线| 婷婷综合五月天| 国产伦精品一区二区三区视频青涩| av中文字幕在线不卡| 欧美精品1区2区3区| 日本一区二区动态图| 亚洲成人综合在线| 国产精品综合一区二区三区| 一本久久精品一区二区| 欧美mv日韩mv国产网站app| 国产精品国产三级国产| 五月天视频一区| 国产成人精品亚洲午夜麻豆| 欧美性大战久久| 欧美精品一区二区三区蜜桃| 一区二区三区在线免费| 国产一区二区三区免费| 在线观看日韩一区| 久久久91精品国产一区二区三区| 亚洲综合偷拍欧美一区色| 精品一区二区免费| 在线观看三级视频欧美| 中文字幕免费观看一区| 美国毛片一区二区| 欧美三级在线播放| 日韩伦理免费电影| 国产福利视频一区二区三区| 欧美一区二区大片| 亚洲韩国精品一区| 91美女福利视频| 久久久另类综合| 日本网站在线观看一区二区三区| 91香蕉视频黄| 欧美国产乱子伦| 韩国欧美国产1区| 日韩一区二区麻豆国产| 亚洲国产cao| 欧洲一区在线电影| 一区在线观看视频| 不卡一区二区中文字幕| 国产视频一区二区三区在线观看| 蜜桃一区二区三区四区| 91精品国产一区二区三区| 亚洲一二三四区| 色先锋久久av资源部| 成人欧美一区二区三区| 成人黄色综合网站| 欧美极品aⅴ影院| 国产精品456露脸| 国产亚洲短视频| 国产美女在线观看一区| 精品区一区二区| 久久精品国产精品亚洲综合| 日韩欧美在线1卡| 韩国毛片一区二区三区| 久久久精品国产免大香伊 | 一区二区在线看| 99综合影院在线| 最新中文字幕一区二区三区| 成人av免费网站| 亚洲女与黑人做爰| 欧美日韩在线精品一区二区三区激情 | 国产成人亚洲综合a∨猫咪| 精品国产一区二区精华| 国产一区999| 国产精品久久久久久久久免费桃花| 成人蜜臀av电影| 亚洲精品ww久久久久久p站| 欧美午夜精品一区| 免费高清在线一区| 日本一区二区三区在线观看| 99久久精品免费看| 亚洲成在人线在线播放| 精品欧美一区二区三区精品久久 | 制服丝袜成人动漫| 久久99国产精品尤物| 久久久亚洲精华液精华液精华液| 国产成人免费视频网站高清观看视频| 欧美激情一区二区在线| 欧美中文一区二区三区| 免费观看日韩av| 国产精品久线观看视频| 欧美在线你懂的| 激情综合网激情| 亚洲精品国产精品乱码不99| 欧美一级日韩免费不卡| 成人av手机在线观看| 日韩高清在线一区| 国产精品你懂的| 777奇米四色成人影色区| 国产成人在线影院| 亚洲1区2区3区4区| 欧美国产一区二区| 欧美久久一区二区| av在线不卡免费看| 麻豆国产91在线播放| 亚洲免费高清视频在线| 精品国产第一区二区三区观看体验| 成av人片一区二区| 看片的网站亚洲| 亚洲精品国产高清久久伦理二区 | 亚洲成人午夜影院| 2021中文字幕一区亚洲| 欧美丝袜丝交足nylons图片| 国产精品一二三四五| 人人超碰91尤物精品国产| 17c精品麻豆一区二区免费| 精品国产一区二区三区av性色| 欧美优质美女网站| eeuss鲁片一区二区三区| 国内外成人在线视频| 日韩国产欧美在线播放| 一区二区三区在线视频观看| 国产欧美日韩久久| 久久色在线视频| 欧美一级片免费看| 色欧美88888久久久久久影院| 国产精品夜夜嗨| 免费在线观看一区二区三区| 亚洲人快播电影网| 国产精品人人做人人爽人人添| 欧美大片在线观看一区二区| 欧美理论在线播放| 欧美性猛交一区二区三区精品| 成人免费av在线| 国产成人精品一区二区三区网站观看| 丝袜诱惑亚洲看片| 亚洲图片欧美一区| 亚洲综合免费观看高清完整版在线| 中文字幕免费不卡| 中文字幕高清一区| 国产精品三级av在线播放| 日韩限制级电影在线观看| 欧美日韩视频专区在线播放| 欧美性videosxxxxx| 欧美亚洲综合另类| 欧美亚洲国产一区二区三区va | 91在线精品秘密一区二区| 国产成人av电影在线| 国产一区二区三区四区五区入口| 久久91精品久久久久久秒播| 裸体一区二区三区| 激情综合网av| 国产一区二区三区久久悠悠色av | 色噜噜狠狠成人中文综合| 天堂久久一区二区三区| 午夜国产精品影院在线观看| 国产精品久久久久永久免费观看| 欧美经典一区二区三区| 国产女同互慰高潮91漫画| 国产丝袜欧美中文另类| 欧美sm美女调教| 日韩欧美一区在线| 久久久精品国产免费观看同学| 久久免费视频色| 亚洲欧洲在线观看av| 一区二区三区中文在线观看| 亚洲图片欧美综合| 丝袜美腿亚洲色图| 老汉av免费一区二区三区| 国产一区二三区| 一本高清dvd不卡在线观看| 欧美日韩小视频| 日韩免费视频线观看| 国产色综合久久| 亚洲欧美色图小说| 天堂一区二区在线| 黄页网站大全一区二区| 国产成人精品免费网站| 99麻豆久久久国产精品免费优播| 欧美日韩一区二区欧美激情| 久久亚洲综合色|