訂閱
糾錯(cuò)
加入自媒體

火山引擎日均50萬(wàn)億token,不如隨手賣GPU賺得多?

2025-12-19 18:22
超聚焦
關(guān)注

火山引擎,想做中國(guó)公有云的“鯰魚”

火山引擎,想做獨(dú)屬于AI時(shí)代的云。

12月18日-19日,火山冬季原動(dòng)力大會(huì)在上海召開,此次大會(huì)上,火山引擎正式發(fā)布了豆包大模型1.8版本,也將豆包圖像創(chuàng)作模型Seedream更新至4.5版本,為用戶們帶來(lái)了更豐富的創(chuàng)作工具與更低門檻的AI應(yīng)用落地方案。

不過(guò),要說(shuō)最被市場(chǎng)關(guān)注的,還得是火山引擎的token調(diào)用量。

而據(jù)火山引擎總裁譚待公布,截至今年12月,該模型的日均調(diào)用量已突破50萬(wàn)億次,較去年同期增長(zhǎng)超十倍,與發(fā)布初期相比更是實(shí)現(xiàn)了417倍的爆發(fā)式增長(zhǎng)。

這也被市場(chǎng)認(rèn)為是火山引擎良好“兌現(xiàn)”自己是云原生AI的最好例證。

不過(guò),在大家都在為這張成績(jī)單驚嘆的背后,卻也產(chǎn)生新的考量:呈幾何倍數(shù)增長(zhǎng)的Token消耗量,究竟能為火山引擎的報(bào)表貢獻(xiàn)多少實(shí)實(shí)在在的營(yíng)收?自我標(biāo)榜為AI原生云的火山引擎,又能否利用AI跨過(guò)國(guó)內(nèi)SaaS重人力的陷阱呢?

01

萬(wàn)億Token

到底能換回多少真金白銀?

要理解火山引擎的野心,得先看清它的“出身”。

在國(guó)內(nèi)云市場(chǎng)的牌桌上,火山引擎是個(gè)“異類”。它不同于阿里、騰訊這些背負(fù)著沉重“傳統(tǒng)云”包袱的前輩,火山引擎幾乎沒有歷史負(fù)擔(dān)——它出生在移動(dòng)互聯(lián)網(wǎng)的黃昏,卻剛好趕上了大模型的黎明。

這種“遲到”反而成了一種戰(zhàn)略紅利。因?yàn)闆]有老舊的數(shù)據(jù)中心架構(gòu)需要兼容,火山引擎從第一天起就活得像個(gè)AI時(shí)代的特種兵:它不想做那種傳統(tǒng)的、靠賣存儲(chǔ)和帶寬過(guò)日子的“包租公”,它想做的是MaaS(模型即服務(wù))的絕對(duì)莊家。

這也是總裁譚待在各種場(chǎng)合反復(fù)布道的邏輯:火山引擎就是為AI而生的云,它的終極形態(tài),就是賣模型調(diào)用,賣智能服務(wù)。

如今,市場(chǎng)確實(shí)買賬了。50萬(wàn)億次的日均調(diào)用量,不僅是一個(gè)讓同行側(cè)目的天文數(shù)字,更像是火山引擎在AI云賽道上跑通了第一條“高速公路”。但熱鬧歸熱鬧,當(dāng)煙花散去,理性的投資者和觀察者終究會(huì)拿起計(jì)算器,算一筆最現(xiàn)實(shí)的賬。

這50萬(wàn)億Token的消耗,到底能給火山引擎帶來(lái)多少營(yíng)收?

我們可以從火山引擎今年披露的幾組核心數(shù)據(jù)中,清晰地捕捉到這種近乎瘋狂的擴(kuò)張曲線。根據(jù)官方發(fā)布及市場(chǎng)公開數(shù)據(jù),火山引擎豆包大模型的日均Token調(diào)用量呈現(xiàn)出了典型的指數(shù)型增長(zhǎng):

2024年12月:日均調(diào)用量?jī)H為4萬(wàn)億次。

2025年4月:迅速攀升至12.7萬(wàn)億次。

2025年5月:達(dá)到16.4萬(wàn)億次。

2025年8月:突破25.9萬(wàn)億次。

2025年10月:穩(wěn)步增長(zhǎng)至30萬(wàn)億次。

2025年12月:最終在原動(dòng)力大會(huì)上宣布,日均調(diào)用量正式突破50萬(wàn)億次。

而如果我們將這些點(diǎn)連接起來(lái),并假設(shè)在統(tǒng)計(jì)區(qū)間內(nèi)消耗量是平穩(wěn)增長(zhǎng)的,那么整個(gè)2025年,豆包大模型的Token消耗總量已經(jīng)超過(guò)9000萬(wàn)億,接近一萬(wàn)萬(wàn)億。

但是,這看似龐大的數(shù)據(jù),卻沒能轉(zhuǎn)化為可觀的收入,而其核心癥結(jié)在于:Token的單價(jià)實(shí)在是太低了。

為了在群雄逐鹿的云市場(chǎng)中撕開一道口子,火山引擎在過(guò)去一年幾乎是以“自殺式”的降價(jià)策略在橫掃市場(chǎng)。

去年5月,火山引擎在業(yè)內(nèi)首先開打價(jià)格戰(zhàn),把豆包主力模型的推理輸入價(jià)格降至0.0008元/千tokens,較當(dāng)時(shí)的行業(yè)價(jià)格下降了超過(guò)99%,而在之后的一年時(shí)間里,也延續(xù)了“崩潰式”降價(jià)的邏輯。

這種推倒重來(lái)的定價(jià)邏輯,雖然讓火山引擎在極短的時(shí)間內(nèi)吸引了海量用戶,但也意味著它必須面對(duì)一個(gè)極其殘酷的現(xiàn)實(shí):Token已經(jīng)從昂貴的“奢侈品”變成了廉價(jià)的“大宗商品”。

那么,2025年一萬(wàn)萬(wàn)億Token,到底為火山引擎帶來(lái)了多少收入呢?我們以火山引擎目前官網(wǎng)的單價(jià)為基準(zhǔn),經(jīng)計(jì)算,在綜合了在線推理、在線推理-上下文緩存、批量推理的價(jià)格后,可得出每千Token的價(jià)格大約在0.0009元附近。

按照目前該單價(jià)計(jì)算,這“一萬(wàn)萬(wàn)億”次的年度總調(diào)用量,理論上能為火山引擎撐起近百億規(guī)模的營(yíng)收空間。

然而,這90億元絕非最終落袋的真金白銀。

在市場(chǎng)推廣的初期,為了跑馬圈地,絕大多數(shù)的Token其實(shí)都是被“免費(fèi)送出”的。在激烈的價(jià)格戰(zhàn)和生態(tài)補(bǔ)貼下,真正產(chǎn)生扣費(fèi)的付費(fèi)流量比例極低。如果我們大膽假設(shè)收費(fèi)Token僅占總量的10%,那么火山引擎2025年實(shí)際的MaaS收入僅為9億元左右。

和MaaS收入形成鮮明對(duì)比的是,2025年火山引擎營(yíng)收已經(jīng)超過(guò)了200億元(約為240億至250億左右)。

這意味著,盡管Token調(diào)用量在官方口徑里顯得氣勢(shì)磅礴,但在現(xiàn)階段,火山引擎營(yíng)收的壓艙石依然是IaaS、PaaS和算力租賃業(yè)務(wù),而非純粹的AI調(diào)用。

這種“頭重腳輕”的數(shù)據(jù)結(jié)構(gòu)清晰地表明:AI原生云的理想很豐滿,但商業(yè)化的現(xiàn)實(shí)依然骨感。

所以,在即將到來(lái)的2026年,火山引擎必須要面對(duì)的一個(gè)問題是,當(dāng)Token徹底淪為像電力一樣的廉價(jià)基建后,如何能快速推動(dòng)Token消耗繼續(xù)指數(shù)級(jí)增長(zhǎng),通過(guò)規(guī)模效應(yīng)來(lái)讓MaaS成為真正的營(yíng)收支柱,成為譚待向市場(chǎng)描繪的那個(gè)火山引擎?

02

當(dāng)Agent遇上傳統(tǒng)甲方

火山引擎也要派人駐場(chǎng)?

如果說(shuō)賣Token是賣電力,那么火山引擎通過(guò)扣子(Coze)等平臺(tái)力推的Agent,就是想直接賣給客戶一套“自動(dòng)化工廠”。

在譚待的藍(lán)圖里,理想的路徑是極其輕盈的:火山引擎搭建好底座和工具,客戶只需像搭積木一樣,在平臺(tái)上自行開發(fā)出適配業(yè)務(wù)的Agent。這本質(zhì)上是在重塑SaaS的交付邏輯,從過(guò)去的“廠商喂到嘴里”,變成現(xiàn)在的“客戶自給自足”。

然而,在國(guó)內(nèi)的商業(yè)土壤上,這種“輕盈”往往意味著某種巨大的挑戰(zhàn):你如何說(shuō)服一個(gè)習(xí)慣了“看人頭付費(fèi)”的甲方,轉(zhuǎn)而為一套看不見摸不著的算法邏輯買單?

國(guó)內(nèi)SaaS行業(yè)過(guò)去十年跌過(guò)的最深的坑,就是“非重人力投入不付費(fèi)”的怪圈。由于國(guó)內(nèi)軟件付費(fèi)意愿長(zhǎng)期處于低位,為數(shù)不多愿意掏錢的企業(yè)客戶,往往信奉一種極其樸素的邏輯:我花了錢,就得看到你的人。

于是,我們看到無(wú)數(shù)標(biāo)榜標(biāo)準(zhǔn)化的SaaS廠商,最后都活成了“裝修外包隊(duì)”。

為了拿下一個(gè)大單,乙方往往要派出一支龐大的交付團(tuán)隊(duì),背著電腦進(jìn)駐甲方場(chǎng)地,陪著對(duì)方熬夜改代碼、調(diào)接口。這種“人頭攢動(dòng)”帶來(lái)的安全感,曾是國(guó)內(nèi)SaaS能夠成交的心理基石。

這種模式不僅重,而且極其低效。一旦進(jìn)入項(xiàng)目制,原本邊際成本遞減的軟件生意,就變成了邊際成本恒定的體力活。火山引擎作為“后來(lái)者”,深知如果跟著其他云廠去卷這種“人肉交付”,不僅難以反超,更會(huì)讓自己標(biāo)榜的“AI原生”底色消失殆盡。

所以,火山引擎的策略是“工具化反擊”。它推出來(lái)的不僅是大模型,還有一整套Agent開發(fā)套件。它的潛臺(tái)詞是:別再找我們要幾百個(gè)工程師了,給你們一個(gè)足夠好用的工具,你們自己的員工就能搞定。

但這正是矛盾的焦點(diǎn)所在。習(xí)慣了“飯來(lái)張口”的甲方,很難在短時(shí)間內(nèi)迅速適應(yīng)這種從“買方案”到“學(xué)工具”的身份轉(zhuǎn)變。對(duì)于大多數(shù)傳統(tǒng)企業(yè)來(lái)說(shuō)AI依然是個(gè)黑盒,Agent的開發(fā)雖然門檻降低了,但“能跑通”和“能落地業(yè)務(wù)”之間,依然隔著萬(wàn)水千山。

更何況,Agent作為一個(gè)新生事物,其穩(wěn)定性、邏輯閉環(huán)以及對(duì)復(fù)雜商業(yè)場(chǎng)景的理解,正處于“半成品”向“成品”進(jìn)化的陣痛期。想要讓一個(gè)剛出爐的Agent達(dá)成過(guò)去由幾十個(gè)程序員、產(chǎn)品經(jīng)理手工打磨出來(lái)的SaaS軟件水平,本身就是一件極難的事情。

當(dāng)甲方發(fā)現(xiàn)自己折騰了半天出來(lái)的Agent還是“人工智障”時(shí),他們最自然的反應(yīng)依然是:火山引擎,你們能不能派點(diǎn)懂行的人來(lái)幫我調(diào)優(yōu)一下?

這就產(chǎn)生了一個(gè)巨大的悖論:火山引擎越是想推行標(biāo)準(zhǔn)化、低門檻的Agent,就越是發(fā)現(xiàn),在實(shí)際落地的“最后一公里”,依然需要大量專業(yè)人員進(jìn)場(chǎng)去填平技術(shù)與業(yè)務(wù)之間的鴻溝。

而如果火山引擎不能在技術(shù)上實(shí)現(xiàn)真正的“類人級(jí)交付”,或者不能培養(yǎng)出一個(gè)龐大的、能夠替它分擔(dān)體力活的第三方合作伙伴生態(tài),那么它標(biāo)榜的AI原生云,極有可能在向深水區(qū)邁進(jìn)時(shí),身不由己地重新掉入那個(gè)“為了賺一百塊,得堆十個(gè)人”的重人力怪圈。

屆時(shí),支撐日均500、5000萬(wàn)億調(diào)用量的,或許不再僅僅是后臺(tái)同步跳動(dòng)的服務(wù)器,還有臺(tái)前無(wú)數(shù)疲憊奔波的交付工程師。這種“新瓶裝舊酒”的局面,恐怕不是譚待想要向市場(chǎng)交出的最終答卷。

火山引擎想做AI時(shí)代的云,這確實(shí)是一個(gè)性感的愿景。但從“萬(wàn)億Token”的狂歡轉(zhuǎn)向“實(shí)打?qū)嵗麧?rùn)”的深耕,這條路上的硬仗才剛剛開始。

當(dāng)技術(shù)的神話遇上商業(yè)的常識(shí),火山引擎需要證明的不僅是它的模型有多快,更是它對(duì)國(guó)內(nèi)商業(yè)生態(tài)的耐力有多強(qiáng)。

- END-

       原文標(biāo)題 : 火山引擎日均50萬(wàn)億token,不如隨手賣GPU賺得多?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)