
文 | 版面之外,作者|畫畫
2026 年初的達沃斯,有點熱鬧。
這個滑雪勝地擠滿了全球 AI 界最有權勢的人。
英偉達的黃仁勛、OpenAI 的薩姆 · 奧特曼、DeepMind 的哈薩比斯、微軟的納德拉、Anthropic 的阿莫迪,說這屆達沃斯是一場 AI 盛會,也絲毫不為過。
在會場里,大家聊得最多的自然還是 AI。不過,大多數(shù)人討論的還是比較虛的話題,比如,AI 到底有沒有像人一樣的意識?它會不會取代人類?這種討論聽起來很高級,但總讓人覺得有點飄在空中。

直到微軟 CEO 納德拉站出來講話,他談論的是:工廠、能效比、總體擁有成本(TCO)以及每瓦特電力能產(chǎn)出多少 Token。
納德拉在現(xiàn)場甚至拋出了一個極其肯定的判斷:未來的 AI 競爭,本質(zhì)上就是一場關于 Token 工廠的效率戰(zhàn)爭。
說白了,AI 的競爭就是蓋工廠、算成本、比效率。
這個觀點在此時顯得格外引人注目。因為它不僅呼應了馬斯克此前的一個預言:未來貨幣本質(zhì)上將是瓦特。
納德拉的思考,更是在遙遠的東方找到了回響。
在關于 Token 價格戰(zhàn)和大規(guī)模調(diào)用的戰(zhàn)役中,張一鳴領導下的火山引擎,已經(jīng)默默在 Token 工廠這條路上跑了很久。
這一次,納德拉坐在了張一鳴的凳子上。
1、AI 正在變成一種工業(yè)品
納德拉在達沃斯的這次發(fā)言,非常有意思,他先是給 AI 行業(yè)潑了一盆冷水,也指明了一條路,意思是說,別再把 AI 當成什么神奇的魔法了,它正在變成一種標準化的工業(yè)產(chǎn)品。
納德拉說,現(xiàn)在的 Azure 已經(jīng)是微軟最大的業(yè)務,未來的核心競爭力在于建設高度異構的基礎設施集群,通過軟件最大化利用率,降低總體擁有成本。
這句話翻譯成大白話就是,別管模型有多玄乎,咱們來算筆賬。如果你的工廠生產(chǎn)一萬個 Token 要花一塊錢,而我的工廠只要一毛錢,那你就沒法跟我競爭。
他在演講中提到的 Token 工廠,本質(zhì)上就是把 AI 算力變成像自來水和電力一樣的公共設施和標準化資源。
這時候,馬斯克的那個判斷就顯得很有前瞻性了。馬斯克前段時間說,未來的貨幣本質(zhì)上將是瓦特。
這話聽著有點極端,但道理是對的。
在 2026 年的今天,所有的智能,不管是寫代碼還是畫圖,到最后消耗的都是電費。誰能用同樣的電,生產(chǎn)出更多、更好的 Token,誰就掌握了定價權。
當很多硅谷精英還在爭論大模型是不是真的懂人類時,沒想到納德拉這么干脆利索,已經(jīng)開始像經(jīng)營電廠一樣,計算每一度電的投入產(chǎn)出比了。
這種從講故事到算成本的轉(zhuǎn)變,將會是今年科技界最大的變化之一。
2、張一鳴走的路,在達沃斯聽到了回響
納德拉關于" Token 工廠"的論述,在中國互聯(lián)網(wǎng)界聽起來一點也不陌生。
如果你回頭看 2024、2025 年的中國大模型市場,你會發(fā)現(xiàn)字節(jié)跳動旗下的火山引擎一直在干一件尤其遭人恨的事:降價、持續(xù)降價。
一句話,沒有最低,只有更低。
當時,很多大模型創(chuàng)業(yè)者都在談技術路線、談榜單跑分,但字節(jié)跳動的打法非常直接,把 Token 價格打到地板上,甚至直接免費。
字節(jié)的邏輯很簡單,大模型如果不被大規(guī)模使用,那就是廢紙。為了讓它跑起來,必須把門檻降到最低,這其實就是納德拉所說的用量優(yōu)先策略。
張一鳴和納德拉在這一點上達成了驚人的共識。
AI 的勝負手不在于誰的模型參數(shù)大,在于誰的 Token 產(chǎn)出效率高、誰的生態(tài)里消耗的 Token 多,還在于誰能大規(guī)模地和廉價地供應給全世界。
字節(jié)跳動為什么敢這么干?
因為它自己就是那個最大的 Token 消耗大戶。
字節(jié)旗下?lián)碛卸兑?、西瓜視頻、今日頭條、飛書等海量應用,這些應用每天產(chǎn)生多少交互?
它在對外賣 Token 之前,自己內(nèi)部就已經(jīng)在瘋狂消耗 Token 了。這種從內(nèi)部需求倒逼出的成本領先,讓字節(jié)在構建 Token 工廠時,天然比單純賣云算力的公司更有動力去壓榨每一瓦特的價值。
納德拉在達沃斯提到的第二點是應用服務層,也正是火山引擎一直在布局的方向。如果你發(fā)現(xiàn)所有人都在構建 AI Agent(智能體),那么你必然需要一個極其穩(wěn)定的應用服務器層。
字節(jié)跳動的豆包大模型,本質(zhì)上就是這個服務器層上的一個超級應用。納德拉的言論,在某種程度上,開云是對張一鳴過去幾年工業(yè)化思維的一次跨洋背書。
3、同樣的 Token,不一樣的生意經(jīng)
雖然納德拉和張一鳴都在談 Token 效率,但由于微軟和字節(jié)的基因和生意模式不同,他們談論 Token 的本質(zhì)邏輯其實是有區(qū)別的。
我們可以把他們看作是電網(wǎng)老板和超級廠家的區(qū)別:
微軟(電網(wǎng)老板):
納德拉的思路是,我要把工廠開到全球,把算力網(wǎng)絡鋪好。他談論能效比,是因為微軟的數(shù)據(jù)中心太多了,如果每一度電能多產(chǎn)出 10% 的內(nèi)容,那省下來的錢就是天文數(shù)字。
納德拉希望全世界的企業(yè)都來用微軟的電,所以他必須證明自己的電是最便宜、最穩(wěn)的。
字節(jié)跳動(超級廠家):
字節(jié)更像是一個本身就要消耗大量電力的工廠。它談論低成本,是為了給自己旗下的短視頻、社交軟件尋找更便宜的燃料。
字節(jié)的領先,是應用場景倒逼出的成本領先。它把 Token 價格打低,是為了分攤自己的研發(fā)成本,順便讓競爭對手在成本上感到絕望,順便擴大自己的生態(tài)圈。
簡單來說,納德拉是在給全世界造插座,而張一鳴是先給自己造了一堆家電,然后發(fā)現(xiàn)由于家電太多,自己造電反而最劃算,順便還把電賣給了隔壁鄰居。
微軟和字節(jié),一個是向外擴張的基建狂魔,一個是向下扎根的應用霸主。
4、Token 是未來嗎?尋找 AI 的"后 Token 指標"
在納德拉和張一鳴的共識背后,我們也必須保持一定的冷思考。
去年的這個時候,剛好是 DeepSeek R1 發(fā)布,現(xiàn)在滿一年。
回過頭看,DeepSeek R1 的發(fā)布不僅是中國 AI 的高光時刻,更是整個行業(yè)邏輯的轉(zhuǎn)折點,它證明了算法的巧勁可以戰(zhàn)勝算力的蠻力,通過算法優(yōu)化可以極大地節(jié)省成本。
這意味著,光有工廠不行,還得有頂級的生產(chǎn)工藝。
那么,當 Token 變得像空氣一樣廉價時,它還是衡量 AI 發(fā)展的核心指標嗎?
答案是:Token 可能很快就會成為歷史。
這對納德拉和張一鳴來說,既是挑戰(zhàn)也是機會。
現(xiàn)在的趨勢是,大模型的競爭指標正在發(fā)生變化,行業(yè)共識已經(jīng)發(fā)生了劇變。以前大家聊模型,第一句話問"你參數(shù)多大?",現(xiàn)在大家問的是"你一個 Token 的推理成本降到幾分錢了?"。
隨著 DeepSeek 驗證了強化學習和模型蒸餾的高效,行業(yè)開始意識到,Token 的數(shù)量雖然重要,但 Token 的含金量和質(zhì)量更重要。
如果一個大模型生成了 100 萬個 Token,卻無法幫用戶定到一張正確的機票,那么這 100 萬個 Token 就是垃圾。在工業(yè)化生產(chǎn)之后,我們需要的是有效產(chǎn)出。
未來,除了 Token 效率,以下三個指標將變得更加關鍵:
5、Token 只是開始,真正的硬仗在后面
{jz:field.toptypename/}納德拉站在張一鳴這一邊,說明全球 AI 的競爭已經(jīng)進入下半場。
當 AI 變成一種可以大規(guī)模、標準化生產(chǎn)的產(chǎn)品,那些還在糾結技術玄學的公司,可能會被迅速淘汰。而那些專注于提升每一瓦特價值的公司,才會笑到最后。
正如納德拉在達沃斯所說,AI 將成為全球經(jīng)濟的動力源。這意味著,未來我們評價一家科技公司,不會再看它發(fā)了多少篇論文,而是看它在實體經(jīng)濟中,到底幫企業(yè)省了多少錢、提了多少效。
張一鳴在中國走了幾步,納德拉現(xiàn)在大聲告訴全世界:這條路是對的。
至少,目前是。
【版面之外】的話:
納德拉和張一鳴都在追求標準化的智能,但商業(yè)世界有一個扎心的規(guī)律,越是標準化的東西,就越不值錢。
當 AI 生產(chǎn)的 Token 變得無比精準、廉價且隨處可見時,那些不標準的東西,比如人類的直覺、帶偏見的創(chuàng)意、甚至是一個雖然低效但符合人類慣性的錯誤,反而會成為新的稀缺品。
AI 發(fā)展越迅猛越普及,人類就越要守住那種不標準,不怎么高效,不怎么聰明的胡思亂想。

