2月1日 消息:谷歌的Bard最近通過(guò)其Gemini Pro版本在LMSYS聊天機(jī)器人榜上超越了OpenAI的GPT-4,標(biāo)志著聊天機(jī)器人領(lǐng)域的一次顯著變革。這款更新使得Bard成為L(zhǎng)MSYS榜上第二高分的聊天機(jī)器人,逐漸擺脫了OpenAI在聊天機(jī)器人領(lǐng)域的主導(dǎo)地位。
在LMSYS Chatbot Arena Leaderboard上,Bard成功超越了GPT-4,目前正迅速追趕保持冠軍的GPT-4Turbo。長(zhǎng)期以來(lái),GPT-4Turbo和GPT-4一直緊握榜單前兩名,而B(niǎo)ard的崛起得益于其搭載谷歌新的Gemini Pro大型多模態(tài)模型。
LMSYS Org創(chuàng)建了Chatbot Arena Leaderboard,該組織是由加州大學(xué)伯克利分校與加州大學(xué)圣迭戈分校以及卡內(nèi)基梅隆大學(xué)合作成立的大型模型系統(tǒng)組織。他們表示,Bard在排行榜上的飆升是一個(gè)“顯著的成就”。
Chatbot Arena是一個(gè)用于大型語(yǔ)言模型的基準(zhǔn)平臺(tái),采用“匿名、隨機(jī)的眾包方式進(jìn)行戰(zhàn)斗”。排名基于Elo評(píng)分系統(tǒng),這在國(guó)際象棋和其他競(jìng)技游戲中被廣泛使用。
由Gemini Pro驅(qū)動(dòng)的Bard是該榜上第二個(gè)達(dá)到1200分以上的模型。Bard的崛起是谷歌更新了支持聊天機(jī)器人的基礎(chǔ)模型的結(jié)果。去年12月,谷歌推出了Gemini,并為Bard推出了初始版本Gemini Pro,預(yù)計(jì)將很快發(fā)布更大規(guī)模的版本Gemini Ultra。
Bard還成功擊敗了Claude的所有版本,Gemini Pro Dev API版本的排名甚至超過(guò)了Anthropic的Claude2.1和GPT3.5Turbo。LMSYS表示:“比賽變得前所未有地激烈!非常期待看到Bard + Gemini Ultra版本的未來(lái)。”
對(duì)于谷歌而言,這次在榜單上的崛起是一個(gè)受歡迎的喘息。在經(jīng)歷了起伏不定的開(kāi)始后,Bard通過(guò)定期更新不斷增強(qiáng),現(xiàn)在已經(jīng)整合到其他谷歌應(yīng)用程序,如YouTube和Docs中。
最近,Reddit用戶告訴谷歌,他們希望Bard更像ChatGPT,谷歌產(chǎn)品經(jīng)理詢問(wèn)了他們的愿望清單。用戶要求有專門(mén)的移動(dòng)應(yīng)用程序、自定義指令和圖像生成,其中一些建議已經(jīng)在實(shí)施中。
OpenAI的GPT-4一直在模型榜單上居高不下,牢牢占據(jù)斯坦福大學(xué)HELM Leaderboard的第一名,而GPT-4Turbo則居于第二位。曾經(jīng)為Bard提供動(dòng)力的PaLM2在HELM排行榜上表現(xiàn)不佳,被來(lái)自AI初創(chuàng)公司W(wǎng)riter的Palmyra X V3超越,成為排行榜上最高得分的非OpenAI模型。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請(qǐng)謹(jǐn)慎對(duì)待。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
海報(bào)生成中...
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。