Meta 最近發布了 LLama3,這是一款新的大型語言模型(LLM),用于實現更安全、更準確的生成式人工智能體驗。除了 LLM,Meta 還推出了 Llama Guard2、Code Shield 和 CyberSec Eval2等信任和安全工具,以幫助確保符合行業和用戶安全期望。盡管 Meta 仍在開發 LLama3AI 模型,但公司現在已經向公眾發布了前兩個模型。
Llama3將安全性內置到模型中,并提供多平臺硬件支持。Meta 指出,LLama3的支持將很快在包括云提供商和模型 API 提供商在內的所有主要平臺上提供。將很快托管 LLama3LLM 的公司包括 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、Nvidia NIM 和 Snowflake。LLM 還將在 AMD、AWS、戴爾、英特爾、Nvidia 和高通的硬件上獲得支持。
高通和英特爾迅速將 LLama3移植到硬件平臺上。用于生成式人工智能的處理器必須快速移動大量數據并進行大規模并行操作的數學處理。這對于所有類型的處理器都是如此,無論是獨立的高性能處理器,還是集成到片上系統(SoC)處理器中的圖形處理單元(GPU)、神經處理單元(NPU)或張量處理單元(TPU)。
至于 LLM 是如何工作的,特別是 LLama3,AI LLM 解釋數據集并將其轉換為機器可解釋的集。這允許生成式人工智能復制類似于構建在先前知識庫上的類似人類的體驗。在零炮點學習(0-shot)測試中,AI 模型沒有專門訓練用于問題中使用的數據。在 n-shot 學習(n >0)測試中,模型已經通過至少 n 個測試問題數據的示例進行了訓練。此外,Meta 還測試了 LLama 的新人類評估集,其中包含1800個涵蓋12種常見用例的提示。
Meta 考慮了 AI 的安全性。通過讓 AI 開發人員對每個應用程序的模型進行微調,Meta 維持了測試用例與模型開發人員之間的分離,以防止意外過擬合。LLM 的超擬合會導致復雜模型基本上是對訓練數據進行記憶,而不是學會如何利用底層模式。LLama3正在開發中,盡管 Meta 已經發布了8B 和70B 模型,但公司仍在訓練400B 參數版本。最后,隨著400億參數顯示出更高的準確性,可以推斷出更高的 AI 硬件需求不會很快減少。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。