善于整活玩猜字謎的OpenAI首席執(zhí)行官Sam Altman又發(fā)了一條神秘消息,“我聽(tīng)說(shuō)o2在GPQA的性能測(cè)試達(dá)到105%。”
最近的研究顯示,GPT-4具備了面部識(shí)別、性別判斷和年齡估算能力,準(zhǔn)確率超越專業(yè)算法,但存在安全隱患。
在剛剛召開(kāi)的“KDDI SUMMIT2024”大會(huì)上,OpenAI日本首席執(zhí)行官長(zhǎng)崎忠雄表示,截止至今年8月底,ChatGPT的月活用戶數(shù)量突破2億大關(guān),成為史上最快達(dá)到這一成就的軟件產(chǎn)品。
今年3月,AI初創(chuàng)公司Cognition發(fā)布的首個(gè)AI程序員Devin引起巨大轟動(dòng),它可以像人一樣實(shí)現(xiàn)端到端的部署、調(diào)試、優(yōu)化代碼,幾乎與編程相關(guān)的任務(wù)都能自動(dòng)化完成。
OpenAI公布了一個(gè)基于GPT-4訓(xùn)練的模型CriticGPT,主要用于捕捉ChatGPT代碼輸出中的錯(cuò)誤。
最新研究稱,越來(lái)越多的人難以在圖靈測(cè)試中區(qū)分 GPT-4 和人類。
據(jù)了解,研究人員向模型提供了匿名化的財(cái)務(wù)數(shù)據(jù),包括資產(chǎn)負(fù)債表和損益表,并要求其預(yù)測(cè)未來(lái)盈利增長(zhǎng)情況。即使沒(méi)有任何額外的信息,GPT-4 也能夠?qū)崿F(xiàn) 60% 的準(zhǔn)確率,而人類分析師的典型準(zhǔn)確率區(qū)間僅為 53% 到 57%。
OpenAI 的聯(lián)合創(chuàng)始人 John Schulman 近在 Dwarkesh Patel 的播客節(jié)目中分享了他對(duì) GPT-4性能的見(jiàn)解,并提到了由于有限的練數(shù)據(jù)而可能面臨的挑戰(zhàn)。Schulman 在2022年11月 ChatGPT 的推出中扮演了重要角色。
在百度文心一言、商湯日日新等當(dāng)下國(guó)內(nèi)主流大模型,陸續(xù)產(chǎn)品迭代升級(jí)至“全面對(duì)標(biāo)GPT-4Turbo”之后,阿里云也入場(chǎng)了。
蘋(píng)果的研究人員推出了一種創(chuàng)新模型ReALM,可將參考解析問(wèn)題轉(zhuǎn)化為語(yǔ)言建模問(wèn)題,能極大提升AI助手處理很多描述復(fù)雜或模糊不清的內(nèi)容。
時(shí)間推進(jìn)到4月15日,微軟開(kāi)發(fā)者官宣了新一代WizardLM,這一次是從Mixtral 8x22B微調(diào)而來(lái)。
就在剛剛,Meta官網(wǎng)上新,官宣了Llama380億和700億參數(shù)版本。
Reka Core是一款最新發(fā)布的多模態(tài)大型語(yǔ)言模型(LLM),其性能可與GPT-4相媲美,甚至在某些方面超越了現(xiàn)有的前沿模型。
近日,OpenAI宣布推出最新版的GPT-4Turbo,這一消息在人工智能領(lǐng)域引起了廣泛關(guān)注。目前新版 GPT-4Turbo 已向所有付費(fèi) ChatGPT 用戶開(kāi)放,這標(biāo)志著人工智能技術(shù)在語(yǔ)言理解和生成方面的又一重大進(jìn)步。
近日,OpenAI宣布推出最新版的GPT-4Turbo,這一消息在人工智能領(lǐng)域引起了廣泛關(guān)注。目前新版 GPT-4Turbo 已向所有付費(fèi) ChatGPT 用戶開(kāi)放,這標(biāo)志著人工智能技術(shù)在語(yǔ)言理解和生成方面的又一重大進(jìn)步。
瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)的研究人員最近進(jìn)行的一項(xiàng)研究表明,GPT-4在說(shuō)服力方面比人類表現(xiàn)更出色,優(yōu)勢(shì)接近82%,準(zhǔn)確來(lái)說(shuō)是81.7%。該研究涉及820人圍繞一系列主題展開(kāi)辯論。這些主題包括是否應(yīng)該考慮種族因素作為大學(xué)錄取標(biāo)準(zhǔn),以及像是否應(yīng)該繼續(xù)發(fā)行便士這樣的低風(fēng)險(xiǎn)主題。
科技媒體 theinformation 近日發(fā)布博文,表示 Meta 公司將于下周預(yù)告兩款 Llama 3 AI 模型,為今年夏季推出“完整形態(tài)” Llama 3 鋪墊。
普林斯頓大學(xué)最近推出了一款名為SWE-agent的AI程序員,這是世界上首個(gè)開(kāi)源的AI程序員,它基于GPT-4技術(shù),能夠在GitHub倉(cāng)庫(kù)中自動(dòng)修復(fù)bug。這個(gè)智能體-計(jì)算機(jī)接口(ACI)的誕生,標(biāo)志著AI在軟件工程領(lǐng)域的應(yīng)用邁出了重要一步。
隨著ChatGPT的出現(xiàn),大語(yǔ)言模型在生成連貫文本和遵循指令方面獲得了巨大技術(shù)突破。然后在推理和解決復(fù)雜內(nèi)容方面,面臨內(nèi)容不準(zhǔn)確、安全等難題。
前幾天,OpenAI 最大的競(jìng)爭(zhēng)對(duì)手 Anthropic 發(fā)布了新一代 AI 大模型系列 —— Claude3。該系列包含三個(gè)“杯型”,按能力由弱到強(qiáng)(價(jià)格由低到高)排列分別是 Claude3Haiku、Claude3Sonnet 和 Claude3Opus。
這兩天,在AI領(lǐng)域又發(fā)生了一件大事。那就是OpenAI的對(duì)手公司Anthropic公司發(fā)布了它們的新模型Claude 3,并宣稱全面超越GPT-4。一夜之間,這個(gè)消息就刷屏了互聯(lián)網(wǎng)。
3月5日消息,OpenAI最強(qiáng)競(jìng)對(duì)Anthropic發(fā)布Claude 3系列模型,已經(jīng)實(shí)現(xiàn)了對(duì)GPT-4的全面超越。
Anthropic 發(fā)布的 Claude3系列模型超越了 GPT-4,在多模態(tài)和語(yǔ)言能力上表現(xiàn)出色。Claude3系列模型包括 Opus、Sonnet 和 Haiku,能力依次從低到高,可以根據(jù)需求選擇合適的模型。
在這場(chǎng)爭(zhēng)奪AIGC話語(yǔ)權(quán)與領(lǐng)導(dǎo)力的追逐戰(zhàn)里,谷歌與微軟爭(zhēng)相拼臂力秀肌肉。Gemini 1.5 Pro的橫空出世,將多模態(tài)大模型的標(biāo)準(zhǔn)提到了一個(gè)新高度。
海藝AI的模型系統(tǒng)在國(guó)際市場(chǎng)上廣受好評(píng),目前站內(nèi)累計(jì)模型數(shù)超過(guò)80萬(wàn)個(gè),涵蓋寫(xiě)實(shí)、二次元、插畫(huà)、設(shè)計(jì)、攝影、風(fēng)格化圖像等多類型應(yīng)用場(chǎng)景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國(guó)際權(quán)威市場(chǎng)調(diào)研機(jī)構(gòu)英富曼(Omdia)發(fā)布了《中國(guó)AI云市場(chǎng),1H25》報(bào)告。中國(guó)AI云市場(chǎng)阿里云占比8%位列第一。
9月24日,華為坤靈召開(kāi)“智能體驗(yàn),一屏到位”華為IdeaHub千行百業(yè)體驗(yàn)官計(jì)劃發(fā)布會(huì)。
IDC今日發(fā)布的《全球智能家居清潔機(jī)器人設(shè)備市場(chǎng)季度跟蹤報(bào)告,2025年第二季度》顯示,上半年全球智能家居清潔機(jī)器人市場(chǎng)出貨1,2萬(wàn)臺(tái),同比增長(zhǎng)33%,顯示出品類強(qiáng)勁的市場(chǎng)需求。