Anthropic 公司在北京時間 5 月 23 日 0 點 30 分舉辦的活動中,推出了 Claude Opus 4 和 Claude Sonnet 4 新一代語言模型,在結(jié)構(gòu)化推理、軟件工程和自主代理行為等領(lǐng)域?qū)崿F(xiàn)重大進(jìn)步。

Claude Opus 4 被定位為 Anthropic 迄今最強(qiáng)大的模型,專為處理復(fù)雜的推理流程和軟件開發(fā)場景設(shè)計。
測試數(shù)據(jù)顯示,該模型在 SWE-bench 基準(zhǔn)測試(評估模型解決真實 GitHub 問題的能力)中準(zhǔn)確率達(dá)到 72.5%;在 TerminalBench 測試(在多步驟終端代碼生成任務(wù)中驗證模型表現(xiàn))中準(zhǔn)確率為 43.2%。

更令人矚目的是,Opus 4 在軟件環(huán)境中展現(xiàn)出強(qiáng)大的自主行為,得益于改進(jìn)的內(nèi)存管理、更廣泛的上下文保留以及更強(qiáng)大的內(nèi)部規(guī)劃機(jī)制,據(jù) Rakuten 測試數(shù)據(jù),可連續(xù)進(jìn)行近 7 小時的代碼生成和任務(wù)執(zhí)行,刷新 AI 世界紀(jì)錄,遠(yuǎn)超前代 Claude 3 Opus(不到 1 小時)。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹(jǐn)慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場出貨1,2萬臺,同比增長33%,顯示出品類強(qiáng)勁的市場需求。