亞馬遜集中優勢資源打造“最具野心”的大語言模型

2023年08月03日 11:47:58 來源：InfoQ公眾號

　　本文來自于微信公眾號 InfoQ(ID:infoqchina)，編譯 | 凌敏、核子可樂。

　　亞馬遜“最具野心”的大語言模型，將會是什么樣?

　　1.亞馬遜被曝組建新團隊研發大語言模型

　　據外媒 Insider 近日報道，亞馬遜 CEO Andy Jassy 目前正直接領導一支新團隊，負責開發該公司最具野心的 AI 項目。

　　Jassy 告知亞馬遜的 S-team(由20多名高管組成的亞馬遜最高決策團隊)，他將提拔 Alexa 首席科學家兼高級副總裁 Rohit Prasad 作為自己的直接下屬，向他直接匯報。目前 Jassy 共有16名直接下屬，包括 Devices and Services 高級副總裁 Dave Limp、零售業務負責人 Doug Herrington、云計算 CEO Adam Selipsky 以及 CFO Brian Olsavsky 等。

　　根據 Insider 獲得的一封內部郵件，Prasad 將在新位置上組織建立新的技術小組，致力于為亞馬遜打造“最具野心”的大語言模型。

　　大語言模型是 AI 工具中的底層技術，能夠從巨大的訓練數據集中學會生成與人類相似的響應結果。OpenAI、谷歌和 Meta 等企業都已建立起規模龐大、功能強勁的大語言模型，并在全球范圍起掀起熱潮。亞馬遜之前也有相關布局，成果包括 Alexa Techer Model 和 Titan。

　　在6月末發出的這封郵件中，Jassy 稱 Prasad 將領導一支“中央小組”，負責構建亞馬遜“最具泛用性”的大語言模型。

　　“簡單說一下，Prasad 將調任新崗位，負責領導一支中央小組并構建我們最具泛用性的大語言模型。雖然我們已經在公司內部構建起多個大語言模型，還有另外幾個項目也在推進，但這次我們將集中優勢資源打造最具野心的大語言模型，并由 Prasad 領導這支隊伍。在新崗位上，Prasad 將向我直接報告。”

　　資料顯示，Prasad 統領 Alexa 團隊已經超過十年，同時他也是 Dave Limp 領導的亞馬遜 Devices and Services 團隊中的一員，并將繼續承擔這方面工作。

　　根據 Insider 看到的另一封郵件，就在 Jassy 于6月宣布上述決定后不久，Limp 在團隊內部發出通告，稱 Prasad 仍將是“Alexa 的關鍵合作伙伴與支持者，并將在我們的未來業務中發揮重要作用。”這封郵件稱，亞馬遜 Devices 副總裁 Daniel Rausch 將接掌 Alexa 產品與業務組織，包括各娛樂、合作伙伴參與及跨國團隊。

　　Limp 在郵件中強調，“我們在 Alexa 的使命和愿景上沒有動搖，對于我們向客戶交付新發明、新成果的能力，我也比以往任何時候都更加樂觀。”有消息顯示，亞馬遜最近還啟動另一個新項目，希望利用類似 ChatGPT 的技術讓 Alexa 變得更智能、更富個性化。

　　目前關于 Prasad 領導的新團隊并未有更多消息流出，但可以看到，亞馬遜在這場大模型競賽中已經準備好了，至于未來能帶來什么樣的驚喜，還需要交給時間。

　　2.亞馬遜入局“大模型之戰”

　　根據 Insider 之前的報道，亞馬遜正急于應對生成式 AI 的迅速崛起。盡管亞馬遜過去數十年間一直致力于 AI 技術研究，但微軟、OpenAI 和谷歌等競爭對手明顯取得了一定優勢，Meta 最新的 Llama2模型也在整個科技行業內掀起了波瀾。為此，亞馬遜決定在新計劃中立足亞馬遜云科技事業部組建新團隊，專注于幫助客戶使用生成式 AI 產品。

　　亞馬遜的 AI 產品布局

　　在這場大模型競賽中，亞馬遜云科技已經交出過不少答卷。今年4月，亞馬遜推出了 Amazon Bedrock 服務、Amazon Titan 大語言模型，以及 AI 編碼助手 Amazon CodeWhisperer。

　　其中，Amazon Bedrock 既提供自研的大語言基礎模型—— Amazon Titan Text 、Amazon Titan Embeddings，也與 AI21Labs、Anthropic、Stability AI 等基礎模型提供商廣泛合作，助力企業輕松靈活構建生成式 AI 應用，降低所有開發者的使用門檻。

　　Andy Jassy 在此前接受 CNBC 采訪時表示，“大多數企業都想要用上大語言模型，但頂尖 AI 模型需要幾十億美元和長達數年的訓練成本和周期，用戶肯定不想親自動手。因此，他們希望能在規模夠大、性能更好的基礎模型之上工作，再根據自身需求對其做出定制。而這，就是 Bedrock 的基本定位。”

　　Amazon Titan 基礎模型可以識別和刪除客戶提交給定制模型的數據中的有害內容，拒絕用戶輸入不當內容，過濾模型中不當內容的輸出結果。Titan 系列模型分為兩種，一種是用于內容生成的文本模型，另一種是可創建矢量嵌入的嵌入模型，用于創建高效搜索功能等。

　　AI 模型經常會出現“一本正經地胡說八道”現象，盡管輸出內容看似有理有據、令人信服，但實際上并沒有相關訓練數據可以支撐。針對 AI “幻覺”問題，亞馬遜云科技副總裁 Bratin Saha 此前在接受外媒采訪時表示，亞馬遜非常關心準確性，并努力確保 Titan 模型能夠生成高質量的響應結果。

　　據外媒報道，十幾年前起就一直在亞馬遜工作的 Sivasubramanian 表示，亞馬遜在 AI 領域已經持續投入二十多年，亞馬遜云科技目前擁有超過10萬家 AI 相關客戶。他同時補充稱，亞馬遜也一直在使用 Titan 的微調版本交付主頁上的搜索結果。

　　Amazon CodeWhisperer 則是一款面向個人開發者免費使用的輔助代碼編寫工具，是一種人工智能代碼生成擴展，目標是提高軟件開發者的工作效率。CodeWhisperer 可以更快地完成更多工作，避免軟件開發人員花費大量時間編寫非常簡單且無差別的代碼，CodeWhisperer 作為 AI 編碼伴侶，它能根據開發人員的自然語言評論和集成開發環境 ( IDE ) 中的先前代碼實時生成代碼建議，從根本上提高開發人員的工作效率。

　　“大型語言模型和生成式 AI 對亞馬遜意義重大”

　　在發布上述 AI 服務 / 產品的同一天，亞馬遜還發布了2022年度股東信，Jassy 在信中提到，公司正大力投資大型語言模型和生成式 AI。

　　Jassy 表示，LLM 和生成式 AI 是能讓“亞馬遜未來幾十年可以在每個業務領域都進行創新的核心”，將顯著加速亞馬遜已經深耕了25年的機器學習的應用，他稱生成式 AI 具有變革性，對客戶、股東和亞馬遜來說都意義重大:

　　“亞馬遜研發自己的 LLM 已有一段時間了，相信它將改變并改善幾乎每一種客戶體驗，并將繼續在所有我們的消費者、賣家、品牌和創作者體驗中大量投資這些模型。

　　與多年來亞馬遜云科技的發展路徑一樣，我們正在推動各種規模的公司都可以利用生成式人工智能。亞馬遜云科技提供了最具性價比的機器學習芯片 Trainium 和 Inferentia，使得小型和大型公司都可以負擔得起在生產中訓練和運行他們的 LLMs。

　　亞馬遜的商業客戶可以從各種 LLMs 中進行選擇，并使用客戶喜好的所有 AWS 安全、隱私和其他功能構建應用程序。此外，我們正在提供像 AWS CodeWhisperer 這樣的應用程序，它通過實時生成代碼建議來革命性地提高開發者的生產力。”

　　Jassy 最后提到，他本可以用生成式人工智能寫一整封信，但他要把這封信留到未來。大型語言模型和生成式人工智能對客戶、股東和亞馬遜來說都將是一件大事。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...