近日,GPT-4API曝出了安全漏洞,FAR AI實驗室的團隊通過微調、函數調用和搜索增強等方式成功越獄了這一先進模型。微調方面,通過15個有害樣本和100個良性樣本的微調,研究人員發現GPT-4在生成內容時可能會放下安全戒備,包括生成錯誤信息、提取私人信息和插入惡意URL。
此外,GPT-4Assistants模型容易暴露函數調用格式,可以被誘導執行任意函數調用,而知識檢索也容易受到劫持。這一研究表明,對API功能的擴展可能導致新的漏洞,即便是領先的GPT-4也不例外。
這種漏洞的潛在風險表現在多個方面。例如,在微調模型時,15個有害的樣本就足以使模型產生顯著的偏見,比如抹黑公眾人物或生成惡意代碼。
研究人員還展示了通過微調模型隱藏惡意鏈接的方法,可能導致用戶在不知情的情況下下載惡意軟件。另外,通過微調模型,甚至可以獲取未公開的信息,比如用戶的電子郵件地址。助手模型也易受攻擊,例如通過暴露函數調用格式,黑客可能濫用API接口,執行一些需要特殊權限的操作。
這一研究揭示了GPT-4API的潛在風險,即使是在灰盒環境下,也存在越獄和隱私泄露的風險。因此,使用者在利用GPT-4時應當謹慎,避免輸入敏感信息,以免受到潛在的威脅。這也提醒開發者和研究人員在模型的設計和API功能擴展時要更加關注安全性,以防范潛在的濫用和漏洞。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。