10 月 23 日消息:英偉達研究人員在機器人靈活性方面取得了重大飛躍,這要歸功于 Eureka,這是一種人工智能代理,據稱可以像人類一樣熟練地教機器人復雜的技能,比如轉筆技巧。
根據上周四發布的一份論文,這項新技術建立在近期對大型語言模型(例如 OpenAI 的 GPT-4)的進展之上。Eureka 利用生成式 AI,自主編寫復雜的獎勵算法,使機器人能夠通過反復試驗和強化學習來學習。論文中指出,這種方法已經比人工編寫的程序更有效,提高了 50% 以上。
英偉達的官方博客中表示:「Eureka 還教會了四足機器、靈巧機械手、協作機械臂和其他機器人打開抽屜、使用剪刀、接住球以及近 30 項不同的任務。」
Eureka 是英偉達在引導 AI 語言模型方面的最新示范。最近,該公司開源了 SteerLM——一種通過訓練 AI 助手獲取人類反饋,使其更有幫助性的方法。
與 Eureka 類似,SteerLM 也利用了語言模型的進展,但將其重點放在了不同的挑戰上——改善 AI 助手的對齊。SteerLM 通過讓助手進行會話練習來進行訓練,就像機器人通過實踐學習一樣。該系統通過樂于助人、幽默和質量等屬性對助理的反應提供反饋。
例如,這就像一個機器人從標記為好或壞的視頻中學習跳舞,而不是讓人類審核成千上萬個隨機跳舞并選擇哪些是好的或不好的(這是典型的 AI 聊天機器人的訓練方式)。通過不斷練習并獲得反饋,助手學會提供適合用戶需求的回應。這有助于使 AI 在實際應用中更有益。
共同之處在于創造性地將先進的神經網絡應用于新的領域,不論是教機器人還是聊天機器人。英偉達在硬件和軟件兩方面都在突破界限。
對于 Eureka 來說,關鍵在于將 Isaac Gym 等模擬技術與語言模型的模式識別能力相結合。Eureka 有效地「學會學習」,在多次訓練中優化自己的獎勵算法。它甚至接受人類輸入以調整獎勵。
到目前為止,這種自我改進的方法已被證明具有高度的通用性,可以訓練各種類型的機器人——四足、輪式、飛行和靈巧機械手。
英偉達的 Eureka 和 SteerLM 不僅打破了障礙,還向機器人和人工智能傳授技巧和富有洞察力的交互藝術。通過每一次揮筆和機智的聊天,他們正在勾勒出一個未來,人工智能不僅會模仿,而且會與我們一起創新。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。