自 5 月 6 日 DeepSeek 提出降價、實現百萬 Tokens 輸入 1 元開始,字節、智譜、阿里、百度、訊飛、騰訊等也先后加入到降價浪潮中。到 5 月 22 日,ERNIE Speed、ERNIE Lite、訊飛星火 Lite、混元-lite 模型等均已實現限定條件下免費。
國內大模型廠商,尤其是以云廠商為代表的模型公司,掀起的降價潮,已經超越了在行業內產生影響,更引發了大眾層面的關注。百度指數上「大模型」關鍵詞在近兩周也有大幅提升。
激進的云廠商的意圖路人皆知:通過降低試用成本,吸引大量試用型開發者;通過模型成本降低,加強云及其他產品的售賣。這背后的一個重要原因則是:大模型層面的競爭激烈,但目前各家差距并不明顯,沒有誰能一騎絕塵、遙遙*,降低成本很可能是一個*的業務策略及競爭策略。
與市場主流預期不同,模型層創業公司現階段還暫未恐慌:
大廠的「降價」當前還有很多的限定條件,真要用起來成本或許并沒有宣傳的那么低;在開發者依然會考慮性能的當下,給創業公司依然留下了生存空間;
大廠的「降價」宣傳加強了市場教育,利好全行業,有廠商告訴 Founder Park 研究中心,近期常規的(非刻意因為降價預付)充值、續費率還略有增長);
有模型廠商的公司高管認為,大廠開源的都是小模型,當用戶量增加時,可能要花費更多精力優化小模型,反而創業公司有可能能有機會優化大參數模型,同時大廠的降價或有可能吸引一部分灰產,很可能需要花精力應對灰產。
但不管對于大廠還是模型層創業公司而言,降低 Token 成本都是未來大勢所趨。便宜的模型、繁榮的開發者生態、*方應用都是這場「百模大戰」接下來競爭關鍵。
01
大廠沒有講明的點:
降價后成本可能依然很貴
Founder Park 研究中心與行業交流,獲知的信息,得出的結論更偏向于:對開發者來說當前的降價更像是「試用裝」,適合要試用大模型的客群,對行業的直接影響并不大。
![]()
這主要是因為:
*,當前部分廠商的「降價」中沒有提 TPM(每分鐘處理內容量)、RPM(每分鐘請求數)兩個限定條件。隨著這兩個重要數值的增加,其成本也會提升。
第二,部分模型「降價」重點降低了輸入端的 Token 價格,輸出端降價低于輸入。
第三,此前很多國內大模型都會在注冊時贈送部分 Token,或者在中小開發者的應用快速起量時給與 Token 支持,基本接近「免費」或者「低價」。
在「降價潮」的兩周內,整個市場的輿論也經歷了幾個階段:
Token 成本因為算法迭代大幅壓低后的行業關注;
Token 成本因為商業策略大幅降低后的大眾關注;
大規模降價引發了行業就大廠是否真降價的反思與討論,如高 TPM、RPM 下的實際成本討論;
大廠模型大規模降價后引發的投資圈反思,如獨立模型層創業者是否還有機會,大廠逼迫模型層公司不得不做應用成為自己*的客戶;
降價能不能解決大模型商業模式的反思。
整體來看,這次降價潮中,大眾層面吃瓜降價熱點,但很多開發者反應相對平淡。這主要是因為:
*,實際部分應用場景中,開發者調用的仍主要是 OpenAI 的接口。其他模型則根據場景不同各有優劣。
第二,在早期量不大的情況下,開發者更在意的是切換模型是否會影響產品效果,是否會存在業務風險。
第三,很多潛在開發者或者潛在客戶還處于找 TPM、PMF 的階段,面臨「找不到使用場景」、「不知道怎么用」等現實難題。
02
大廠談「免費」,
創業者怎么辦?
從 Founder Park 近期與行業交流的信息來看,當前模型層創業公司暫未產生媒體宣傳中的恐慌。
多家創業公司的從業者告訴 Founder Park,大廠的「降價」、「免費」宣傳加強了市場教育,利好全行業。
更為重要的意義是,這也給了應用側行業信心,未來的 Token 成本一定是「便宜到可以忽略不計」的,會變成行業的基礎設施,可以在這樣的前提背景下解決真實問題、關鍵問題。
但對于獨立的模型廠商來說,市場競爭會牽引行業在這個點上飽和攻擊,最終讓 Token 成本趨近于免費。接下來的競爭策略都是不得不思考的問題。這其中既包括業務模式的思考,也包括通過技術手段降低成本。
首先,如果模型本身可能很難收到錢,獨立的模型廠商就不得不自研應用,考慮靠應用收回部分成本。大廠的模型降價潮奠定了未來模型本身可能不一定能賺錢的基調,模型廠商就不得不思考這一轉變。Founder Park 近期與一些關注 AGI 的投資人交流,對方也表達了類似的觀點。
從資本的視角來看,模型層公司自己研發應用一直很重要。但以往,主要是因為要對外傳達自己是自己模型的*客戶,既可以平攤一部分成本,又可以不斷優化模型,才能打造自身模型的重要特色,并對類似客戶形成吸引力。這與云廠商的發展策略類似。
這樣的思考主要來自上一階段的產業實踐。比如,在大模型公司內部,他們往往有一套更有針對性的評測基準。一位知名大模型公司的產品負責人表示,這套內部的評測基準,需要非常漫長的調試才能成型,它實際上是一家大模型公司最核心的資產,為自己模型的訓練和迭代提供方向。而這樣的「資產」建立,也往往需要自有應用的支持和配合。
但當下,考慮到未來的降價潮、免費可能性,自研應用的戰略意義也會進一步加強。
當前,大模型還是技術驅動,比拼性能,還處于「智能能力決定下限,決定是否可以普及」的階段。隨著開發者發現免費的模型只能解決「試用」場景時,最終還是會回歸到性能的比拼,選擇更有利于業務的模型。只有不斷提升模型智能能力,才有機會活在牌桌上。
對于創業公司來說,專注在用技術的方式,去不斷優化成本,不斷從 infra 到模型訓練和調優,再到交互的每個環節里,優化效率,才有可能在競爭中取得優勢。這一點,字節旗下的豆包、火山云也提到了,火山引擎總裁譚待認為,「豆包模型的超低定價,來源于我們有信心用技術手段優化成本,而不是補貼或是打價格戰爭奪市場份額。」
其次,宣傳層面,Founder Park 了解到,一些創業公司也在思考「免費」以外的宣傳亮點,以獲得更多用戶。
成本不是當前客戶*關注的重點。比如,傅盛提出「降價對企業用戶影響有限。企業用戶需要 AI 應用,更關心數據安全。現在開源小參數大模型加應用套件,可以滿足絕大多數的企業需求了」。
03
降價是大勢所趨,
未來 token 會便宜到忽略不計
雖然此次對云廠商真實降價力度存在爭議,但可以預見,模型降價是大勢所趨。放到更長線的產業周期里,未來 Token 的價格可能便宜到忽略不計。
首先,現實主義的原因是模型廠商「競爭策略」的需要。
短期來看,大模型廠商之間的差距并不明顯。在沒有殺手锏、護城河的情況下,低價就有可能是吸引客戶的重要策略。
此前我們在《》一文中已經提到,大模型今天可以在模型的「能力范圍內」做很多業務,但是成本非常高。比如,當前大模型的智商其實可以達到高中生水平,就可以做很多服務于幼兒、兒童的場景;比如大模型的幻覺能力,可以在一定場景中演變為創意能力,可以在創意行業應用。但是這些場景還很難在用戶端收到足夠多的錢,因此,過去一年中,很多做出有一定影響力產品的開發者都表達了「燒不起 Token」。
其次,基于摩爾定律,大模型屬于 IT 技術,理論上成本也會不斷降低。今天,大廠則是通過商業行為,加速了降價。
投資機構拾象在 2024 年初曾做過一個總結,「模型訓練的成本在過去 18 個月已經降了 4- 5 倍,模型推理的成本在過去 18 個月降了 10 倍左右」。基于此,他們提出了「新時代摩爾定律」:每 1-2 年模型水平就能提升一到兩代,模型訓練成本每 18 個月就會降低至原來的 1/4、推理成本每 18 個月降低至是原來的 1/10,未來模型推理成本做到今天 1% 這件事是非常可預期的。
事實上,自去年市場上出現開源模型以來,整個市場的模型訓練及模型調用成本也在大幅下滑,私有部署從最早的幾千萬元降到了幾十萬元量級,同樣性能的模型成本至少低了不止一個數量級。
再次,只有 Token 成本足夠低,才有可能促進大模型生態的繁榮,進而使得產業鏈上的公司都是賺錢的。
雖然每一代技術出現時,大家都會研究「先有雞還是先有蛋」的問題,但歷史多次證明,「只有看見才能相信」。摩爾定律之下,每個人都會保有成本降低的預期,但實際上只有看到性能的上限和可以做的事情開發者才有可能入場。
在上篇文章《》的《要「便宜的可以忽略不計」》的章節里,我們也提到:在 AGI 領域,如果有一種「智能聚合網絡效應」,那么這種加強版網絡效應就意味著,用戶數量的增長能夠帶來系統整體價值的提升。在這樣的背景下,免費模式理論上有可能成為一種有效的市場策略。在 AGI 領域中,如果免費模式有助于企業快速做大規模,進而有可能做大營收和利潤,那么這種模式的可行性在很大程度上依賴于大模型推理的成本降低。大模型推理所需的 Token 是 AI 系統運作的基礎,其成本直接影響到企業的運營費用和盈利能力。
為了確保免費模式或者低價模式的可行性,我們需要一個前提條件:未來大模型推理時的 Token 要便宜到忽略不計。為了生態的繁榮,最終也會倒逼上游降低成本。
當下,開發者毫無疑問的會成為稀缺資源,成為模型廠商爭相搶奪的對象。有網友調侃,可能很快模型廠商就要給開發者發補貼了。
Founder Park 近期的訪談中,也有創業者表達出了對于大廠的顧慮,集中體現在對于大廠盜用創意與數據的擔憂。考慮到今天的應用普遍都還「太輕」,這一顧慮或并不成立。
但當 Token 有可能便宜到忽略不計,未來的商業模式的規劃或許更值得思考。很可能依據公司自身實力,未來的商業策略演變為兩種完全不同的路徑:一是服務于客戶,向用戶免費,依然走「大事業」路線,靠免費做大規模并謀求大 GMV 或者大流量;一是服務于用戶,直接面向用戶收費,實現更高的利潤率。
而對于行業來說,更重要的因素或許還是,大模型的商業模式該如何走通。
與其他軟件行業相比,大模型的 ROI 在當下還很難算回來。一名有美國資本背景的投資人表示,在他看來,當前大模型公司的收入其實不能看做「ARR」,反而更應該看作實驗性質的一次性收入,這筆收入很可能在 6 個月后因為新的模型出現而重新進行開發。
賈揚清在高山書院硅谷站「高山夜話」活動中也提到過類似的觀點,「大模型對比傳統軟件,可以創造營收的時間太短」。開發完 Windows,可能在接下來的 5-10 年當中持續迭代、收回成本。但大模型每次訓練過一個模型之后,下一次還是要從零開始重新訓練,需要持續追加投入,但模型的迭代速度又很快,中間能夠賺錢的時間窗口很可能是一年左右,甚至更短。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。