5月8日,OpenAI在官網宣布,將推出面向其文生圖模型DALL·E3的內容識別器,以及一個媒體管理器。
隨著ChatGPT、DALL·E3等生成式AI產品被大量應用在實際業務中,人們越來越難分辨AI和人類創建內容的區別,這個識別器可以幫助開發人員快速識別內容的真假。
目前,OpenAI已經開放了DALL·E3識別器的API,開發人員從今天開始至7月31日可申請試用。OpenAI會在8月31日之前公布獲取使用權限的名單。
這個媒體管理器主要是面向媒體行業、內容創作者的產品,幫助控制自己的知識產權內容是否會被OpenAI搜集用于訓練AI模型。
AI生成的內容真假難辨
由于DALL·E3等大模型生成的圖片能達到以假亂真的效果,例如,AI合成的斯威夫特色情照片被瘋傳。
早在今年2月7日,OpenAI宣布在DALL·E3生成的圖片中嵌入了 C2PA的元數據,以防止圖片被非法亂用。即將發布的文生視頻模型Sora,也會集成C2PA元數據。
C2PA是一種開放數據標準,允許出版商、企業、開發者等,通過元數據來跟蹤和驗證數字內容,例如,圖片、視頻、文檔等,最初來源、真實性和完整性等。
但這些還遠遠不夠,因為可以通過技術手段去除這些元數據,使得人們在視覺上還是無法分辨。所以,OpenAI開發了這款內容識別器幫助開發人員、用戶來識別內容真假。
OpenAI表示,即便對AI生成的圖片進行壓縮、裁剪、更改飽和度/顏色、去除水印、改變形狀等各種常規操作,識別器的準確率仍高達98%。
此外,AI生成語音的造假能力比文本、圖片、視頻高出好幾倍,并且已經有人被AI語音詐騙過錢財。
OpenAI還開發了一種音頻水印,將其集成在自定義語音模型 Voice Engine中,目前處于產品預覽階段。
媒體管理器,保護知識產權
前不久,《紐約日報》、《芝加哥論壇報》、《奧蘭多前哨報》、《水星報》等8家知名媒體聯名狀告OpenAI,在沒有獲取授權的情況下使用其文章訓練AI模型。而谷歌也因為非法搜集數據,同樣被起訴過。
目前,OpenAI用于訓練AI模型的數據主要有兩個渠道:第一個,付費知識產權渠道,例如,OpenAI與《金融時報》、《世界報》、Prisa Media、Axel Springer等媒體簽訂的數據合作協議,每年支付他們上千萬歐元以獲取使用數據的權利。
第二個,公開渠道,這包括大量的開源數據集和通過爬蟲獲取到的數據。爬蟲在抓取的過程中可能會非法搜集一些知名網站的數據,就會出現那8家媒體狀告OpenAI的情況。
因此,OpenAI正在開發一款“媒體管理器”,可以輕松管理知識產權內容,哪些可以被AI搜集,哪些不可以。預計該產品將在2025年之前發布。
OpenAI最近還對ChatGPT生成的內容加上了原始網站鏈接,例如,達拉斯最適合午夜約會的5家餐廳。ChatGPT會在回答的每一條內容上加上餐廳的官網地址。
一方面,可以保護知識產權增加內容的可信度;另一方面,正在為其推出的搜索引擎做鋪墊,可以像谷歌搜索那樣列出所有答案的原始鏈接。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。