Bye Siri ! 大模型能做的可不止是聊天機器人

2023年08月08日 15:49:22 來源：大模型之家

　　在眾多人工智能大模型發布會上，自然語言處理(NLP)能力一直是各大科技廠商著重展示的要點之一，事實上，早在四年前行業內的就已經圍繞這顆人工智能“皇冠上的明珠”展開過激烈的討論……

　　彼時的人工智能還沒有今日的火熱，很多人對自然語言處理(NLP)的理解還停留在“Hi，Siri”和“小度小度”等智能對話機器人。能否實現與人流利對話也成為了人們判斷人工智能能力的一大重要手段。隨著ChatGPT、文心一言、360智腦等眾多大模型紛紛問世，讓大語言模型成為了人們關注的焦點，也讓人工智能的認識更加深入和全面。

　　大語言模型是聊天機器人嗎?

　　在大模型未出現時，聊天機器人的自然語言處理僅停留在對固定問題的固定回答上，甚至換一種問法都很難得到答案，甚至一些“智能語音客服”至今也只能聽懂一些預設問題，哪怕面對稍有變化的指令或問題，都很難為用戶提供被需要的解救辦法。

　　而具有大模型加持的聊天機器人在面對多樣化的問題已經可以通過總結自身數據庫中的數據為使用者生成答案。有業內人士對大模型之家表示，LLM當然不等價于Chatbot，不過現在的LLM很多都是用Chat數據指令調諧過的，Chat版本的LLM更適合用來構建Chatbot，技術上不能劃等號。

　　聊天機器人是一種能夠與人進行自然對話的系統，通常需要利用大語言模型來生成回復。為了讓大語言模型更適合用于聊天機器人，可以在聊天數據上進行額外的訓練，使其學習到更多的對話技巧和知識。因此，雖然大語言模型和聊天機器人有一定的關聯，但它們在技術上是不同的概念。

　　無界AI聯合創始人馬千里對大模型之家表示，聊天機器人是語言大模型的眾多功能或應用之一。語言大模型不應局限于聊天這一狹隘的場景。大模型不僅能夠實現自然語言處理，還能通過各種插件功能，為使用者提供計算、文檔總結、工作相關問題解答等服務。

　　大模型之家認為，大語言模型和聊天機器人的不同概念源自于不同的目標、評價指標、數據類型、數據規模、用戶和場景。聊天機器人只是大語言模型的一個功能或應用，而不是它的本質。大模型的存在除了應用在自然語言處理方面，更重要的是體現在生產中的意義，大語言模型還有很多其他的功能或應用，比如音視頻生成、金融、法律咨詢等，這些都體現了大語言模型的能力和潛力。也是大語言模型商業化的重要方向。

　　大語言模型表現良莠不齊，根源在哪兒?

　　在大多數大模型發布會上，自然語言處理能力仍是被著重展示的部分，而對于使用者來說，聊天能力確實是判斷大模型強大與否的重要指標之一。事實上大語言模型的表現并未像市場中吹捧的那般天花亂墜。360集團創始人周鴻祎也于近期表示，誰能解決大模型“幻覺”問題，就相當于摘下了“皇冠上的明珠”。

　　很多人認為市場上大模型對話能力的參差不齊與大模型研發的技術水平有著直接關系，在繁多的技術當中，數據的質量是影響大模型表現的關鍵技術因素，它決定了模型能否有效地學習和生成文本。數據質量需要從數據的正確性、有效性、豐富性和代表性等方面來提高。這需要經過數據清洗、標注、過濾和多樣化等方法，保證數據沒有錯誤或者矛盾，去除低質量和垃圾數據，涵蓋不同的主題、領域、風格和觀點。提高數據質量是影響大模型表現的關鍵技術因素，也是未來文本生成領域的重要研究方向。

　　行業領先人工智能企業「行者AI」對大模型之家表示：雖然如今大語言模型參數規模越來越大，涌現出的能力也越來越強，但它歸根結底仍然是一種概率統計模型，因此理論上來說，即使是目前最好的模型，仍然有一定概率輸出不佳的結果，只是這種概率較小而已。

　　而具體從技術上來說，大語言模型表現好壞受眾多因素影響，其一是訓練數據的質量和數量，模型本質上是以訓練數據為老師進行學習，數據的質量和數量直接決定模型的上限，數據質量在某些方面的參差不齊可能會導致模型回答時有好有壞;其二是模型的架構和訓練策略，訓練模型時選擇的不同模型架構和訓練策略會導致最終得到的模型性能有所差異。

　　當然，除技術之外，無界AI聯合創始人馬千里認為，大模型表現的好壞，人的“問題”也占很大一部分。他指出，大語言模型的效果同樣受到提問者輸入的影響。使用者需要輸入一個恰當的提示語后再提出問題。而問題的形式和方式會決定模型的回答質量，因此不同的使用者可能獲得不同的體驗。其次，模型本身也在持續更新和優化。由于部署在云端，為了保證安全性，它增加了對敏感內容的審核機制，如果使用者詢問一些涉及危險信息的問題，大模型可能不會給出回答。

　　同時，大模型的本質神經網絡生成內容的過程，數據、參數以及算法都具有一定的隨機性，能提高大模型的泛化能力和創造力，但也會導致大模型的不穩定和不可預測。因此，使用者需要根據不同的數據和任務，選擇合適的隨機操作和超參數，以及監控和評估大模型的表現。

　　在《人工智能大模型產業創新價值研究報告》中，大模型之家認為，大模型將引發數據的革命。數據的質量以及數據清洗的工程化能力會顯著拉開大模型預訓練階段的效果差距將成為決勝關鍵因素。同時大模型的發展將為數據相關產業和行業帶來多重機遇，包括數據分析和洞察力，數據清洗和預處理，數據驅動的創新，數據安全和隱私保護以及數據驅動的行業轉型等。

　　大模型是一種技術，也是一種趨勢。決定大模型表現的也不止需要對數據質量進行把控，模型可解釋性、安全性、創新性甚至使用者的操作都是必要考慮關鍵因素。除了聊天機器人，大模型能夠在不同的領域和任務中表現出優秀的通用性和創造性，例如自然語言生成、圖像識別、語音合成等。此外，大模型的訓練和應用也依賴于高效的硬件和軟件支持，例如GPU、TPU等處理器，以及分布式并行的平臺和方法。

　　文章內容僅供閱讀，不構成投資建議，請謹慎對待。投資者據此操作，風險自擔。

海報生成中...