近期,Jones和Bergen進行了一項關于GPT-4在圖靈測試中的研究,結果顯示其成功率超過41%。
這一數字相比于傳統的人工智能模型,如ELIZA的27%和GPT-3.5的14%,表現出明顯的優勢。研究設計了25個不同的語言模型,涵蓋了各種GPT的版本,其中包括GPT-4。這些模型使用類似于手機消息應用的界面,并在拼寫錯誤、大小寫、延遲等方面引入了小的隨機變化。
圖靈測試是通過與人類進行對話,然后判斷對方是人類還是人工智能的測試。與原始的圖靈測試不同,這項研究的測試設計更簡化,要求參與者在最多5分鐘的時間內進行對話,每條消息不超過300字符。共有652名人類參與者完成了1810次測試。
1950年,艾倫·圖靈曾預測,到了他認為的未來50年,計算機將具備足夠的存儲能力,以70%的概率“欺騙”人類。然而,研究表明,即使到了現在,GPT-4等模型也未達到這一水平,最高成功率僅為41%。
有趣的是,研究指出GPT-4是付費版本,而GPT-3.5則是免費版本。這表明,付費版本在測試中表現更好,凸顯了技術進步對結果質量的影響。
人工智能在圖靈測試中取得的進展令人印象深刻,但與人類63%的成功率相比,仍有改進的空間。這一研究進一步探討了人工智能的發展趨勢,揭示了技術的潛在局限性。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。