用戶所使用的語言對于大型語言模型(LLM)的費用有很大的影響,可能造成英語使用者和其它語言使用者之間的人工智能鴻溝。最近的一項研究顯示,由于 OpenAI 等服務(wù)所采用的的服務(wù)器成本衡量和計費的方式,英語輸入和輸出的費用要比其他語言低得多,其中簡體中文的費用大約是英語的兩倍,西班牙語是英語的 1.5 倍,而緬甸的撣語則是英語的 15 倍。
IT之家注意到,推特用戶 Dylan Patel(@dlan522p)分享了一張照片,展示了牛津大學(xué)進行的一項研究,該研究發(fā)現(xiàn),讓一個 LLM 處理一句緬甸語句子需要 198 個詞元(tokens),而同樣的句子用英語寫只需要 17 個詞元。詞元代表了通過 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)訪問 LLM 所需的計算力成本,這意味著緬甸語句子使用這種服務(wù)的成本比英語句子高出 11 倍。
詞元化模型(即人工智能公司將用戶輸入轉(zhuǎn)換為計算成本的方式)意味著,除了英語之外的其他語言使用和訓(xùn)練模型要貴得多。這是因為像中文這樣的語言有著不同、更復(fù)雜的結(jié)構(gòu)(無論是從語法還是字符數(shù)量上),導(dǎo)致它們需要更高的詞元化率。例如,根據(jù) OpenAI 的 GPT3 分詞器 ,“你的愛意(your affection)”的詞元,在英語中只需要兩個詞元,但在簡體中文中需要八個詞元。盡管簡體中文文本只有 4 個字符(你的愛意),而英文有 14 個字符。
文章內(nèi)容僅供閱讀,不構(gòu)成投資建議,請謹慎對待。投資者據(jù)此操作,風(fēng)險自擔(dān)。
海報生成中...
海藝AI的模型系統(tǒng)在國際市場上廣受好評,目前站內(nèi)累計模型數(shù)超過80萬個,涵蓋寫實、二次元、插畫、設(shè)計、攝影、風(fēng)格化圖像等多類型應(yīng)用場景,基本覆蓋所有主流創(chuàng)作風(fēng)格。
9月9日,國際權(quán)威市場調(diào)研機構(gòu)英富曼(Omdia)發(fā)布了《中國AI云市場,1H25》報告。中國AI云市場阿里云占比8%位列第一。
IDC今日發(fā)布的《全球智能家居清潔機器人設(shè)備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。