发布日期:2026-04-25 22:38 点击次数:190

文 | 版面以外,作家|版君
英伟达和谷歌,两场大会,两个东谈主,说了归并个词。
3 月 16 日,圣何塞,GTC 2026。黄仁勋把数据中心界说为 " 出产 Token 的工场 ",并给出一个惊东谈主的判断,到 2027 年,这个市集的需求界限至少 1 万亿好意思元。
4 月 22 日,拉斯维加斯,Google Cloud Next 2026。桑达尔 · 皮查伊给出另一组数字:谷歌每分钟处理 160 亿个 token,上个季度照旧 100 亿。本大哥本开支 1750 亿到 1850 亿好意思元。
两个东谈主都在谈 Token。但一个在描画供给,一个在展示破钞。
当年很长一段期间,外界风俗性地把谷歌放在追逐者的位置。
这个判断,正在失效。
把这两场大会放在一齐看,会发现一个更关节的变化:这不是归并场竞争。
一、卖铲子的,和造工场的
默契这两家公司,先要看清它们各安宁卖什么。
英伟达的家具,是出产云尔。
GPU 是通用算力,从 OpenAI 到 Meta,从字节朝上到主权基金,确切通盘头部 AI 玩家,都在它的客户名单里。
CUDA 生态麇集超 600 万众人开采者、900 余个 CUDA-X 加快库,二十年接续迭代的生态飞轮,早已成为 AI 时间算力底层的法子件。
黄仁勋那句判断很有代表性:即便竞争敌手的架构是免费的,也偶而足够低廉。
2025 财年,NVIDIA 数据中心业务收入高出 1150 亿好意思元,同比增长高出 200%,毛利率在 75% 以上,在众人 AI 加快器市集占据约 80% 的份额。
换句话说,每 10 块 AI 算力芯片里,至少有 8 块来自英伟达。
这是一门典型的卖铲子的交易,并且是通盘东谈主都离不开的那种。
谷歌的旅途完全不同,它提供的不是单一器用,而是一整套运行体系。
自研 TPU 芯片、检修 Gemini 模子、运行在 Cloud 之上,再对外提供处事。从底层算力到表层利用,全部买通。
咫尺 Google 云业务年收入已接近 600 亿好意思元,当年一年增长接近 50%,AI 相干需求成为最中枢的驱能源。
这种形状更像是我方搭建了一座圆善的工场,再把饱和的产能对外输出。
英伟达的逻辑,是把缔造卖给通盘东谈主。谷歌的旅途,则是先把体系跑起来,再让别东谈主接入。
一个掌执出产云尔,一个在组织出产经由。
二、TPU 一刀切两半
此次谷歌 Cloud Next,TPU 最值得隆重的变化,不在参数,而在结构。
从 2017 年 TPU v2 起至 2025 年 v7 Ironwood,整整六代家具,谷歌持久经受单颗通用芯片同期承载大模子检修与推理任务。
直到此次发布第八代 TPU,谷歌初度透彻策略转向,将检修、推理拆分为两颗专属独处芯片(TPU 8t、TPU 8i)。
分家的原因很成功,Agent 时间,推理和检修的负载特征完全不同。
一个智能体完成任务,频频需要屡次调用模子,每一次调用都条款低蔓延、高并发。这和检修阶段的采集算力需求完全不同。
一颗芯片同期跑检修和推理,哪头都拼凑,哪头都不够好。
背后的算账逻辑很明晰。检修是一次性参加,模子训好就行。推理是接续性破钞,用户每用一次就推理一次。
当 token 界限从 100 亿 / 分钟跃升到 160 亿 / 分钟,推理端的效果运转成功决定成本结构。
这也解释了两家公司时候旅途的各异。英伟达接续优化单颗芯片性能,谷歌更热心集群效果与举座成本。
三、Anthropic 的一百万颗芯片
TPU 从里面器用走向外部市集,有一个较着的象征,运转承载头部模子公司的中枢负载。
2025 年 10 月,Anthropic 与谷歌签了一份多年期契约,最多使用 100 万颗 Ironwood TPU,价值数百亿好意思元。
这是 AI 历史上最大的单笔算力往来。
紧接着,Meta 传出正在推敲从 2027 年起部署 TPU。音尘一出,英伟达股价今日大跌。
这一系列动作,对英伟达来说,米兰体育官方网站是最危机的信号。不是某个小公司在试水,是 Anthropic,是 Meta,众人头部的大模子公司,都要把自家最中枢的推理负载全部押在了 TPU 上。
谷歌的策略很明确:用 Anthropic 和 Meta 作念样板客户,证明注解 TPU 能替代英伟达,然后通过 Cloud 平台把 TPU 算力卖给通盘企业。
如若说英伟达的上风在软件生态,CUDA 酿成了强绑定。谷歌的冲突口,则来自成本。
Ironwood TPU 的核神思算是显赫裁减总领有成本。精密分析显露,其每好意思元性能 / 价钱比较前代晋升 2 倍,比拟 NVIDIA B200 在总领有成本上具有约 30%~41% 的上风,可有用匡助企业铁心推理成本。
当推理成本被压到敌手的一半以下,软件壁垒就运转松动了。因为企业算账的时候,省下来的钱足够遮蔽迁徙成本。
时候壁垒依然存在,但经济驱动运转改革选拔。
四、160 亿 token 背后的实话
皮查伊在 Cloud Next 上说了三个数字:160 亿 token 每分钟。75% 的新代码由 AI 生成。本年参加 1750 亿到 1850 亿好意思元。
看起来漫步,其实指向归并件事。
这些 token,不仅仅 API 调用,还包括搜索、告白、YouTube 推选、安全系统和里面开采。
从 100 亿到 160 亿,单季度增长高出 60%,按这个界限估算,谷歌每天处理的 token 依然达到万亿级。
算作对比,刻下头部模子公司的 API 调用,约莫处在数百亿到千亿 token/ 天的区间。
谷歌的体量,依然超出单一模子公司的限制,更接近一个基础法子级消费体。
这和黄仁勋建议的 "Token 工场 ",酿成了一个故事理的对照。
黄仁勋描画的是一个卖方市集。Token 是商品,GPU 是出产缔造,价钱分五个层级,从免费到 150 好意思元每百万 token。你来买缔造,出产 Token,卖给你的客户。
他在 GTC 上连 Token 的订价体系都替行业联想好了。
英伟达围绕供给侧构建体系,谷歌则在放大需求侧界限。
一个界说产能,一个吞下产能。而持久来看,需求会反过来塑造供给。
谷歌对 TPU 性价比的优化能源,远超任何外部客户,因为每裁减一分钱的推理成本,省下来的钱领先进了我方的口袋。本体上,谷歌我方即是全天下最大的 Token 消费者。
五、谁会赢?
短期看,英伟达赢。CUDA 生态的壁垒、80% 的市集份额、75% 以上的毛利率,这些不会整夜被颠覆。
黄仁勋直言,到 2027 年英伟达将迎来至少 1 万亿好意思元的细则性算力需求;其中 60% 来自众人前五大超大界限云厂商,剩余 40% 漫步于企业荒谬部署、主权云、角落计议及全行业场景。
这份预判,有着王人备的底气。
但谷歌正在把竞争拉到英伟达不擅长的维度。
此次 Cloud Next 上,GE 在谷歌的 Agent 平台上跑了高出 800 个智能体,遮蔽制造、物流和供应链。毕马威首月部署高出 100 个智能体,90% 的职工在用。默克签了 10 亿好意思元合同。
谷歌云 CEO 库里安还阐述,基于 Gemini 构建的苹果新一代 Siri 将于本年发布,相助每年价值约 10 亿好意思元。
当企业客户的需求从一块 GPU 变成了帮我管住一千个 Agent,卖芯片的就比不外卖系统的了。
英伟达处治的是有莫得算力,谷歌要处治的是算力怎么被用起来。
这不是谁杀死谁的故事。就像石油行业既有卖钻头的哈里伯顿,也有我方钻井、真金不怕火葬、零卖一条龙的沙特阿好意思。两种形状会持久共存。
但有一件事正在发生变化。
当年,英伟达是通盘东谈主的唯独选拔。当今,谷歌证明注解了另一条路走得通。Anthropic 选了 TPU,Meta 在推敲 TPU,苹果把 Siri 交给了谷歌 Gemini。
选拔变多了。对把持者来说,这即是最大的威逼。
ChatGPT 出来后的两年多,谷歌看起来像一个追逐者。但 Cloud Next 讲了一个不同的故事,谷歌莫得赢模子竞赛,但它把 AI 再行变回了一个基础法子问题。
而作念基础法子,偶合是谷歌最擅长的事。
谷歌不是在追英伟达,也并非念念在芯片战场击败英伟达。
从一运转,它们跑的就不是归并场比赛。
【版面以外】的话:
AI 的上半场,是检修模子。下半场,是管千里着冷静能体。结尾,可能是铁心系统。
黄仁勋说 Token 是新的大量商品。皮查伊说谷歌每分钟破钞 160 亿个。一个在界说市集,一个在吃下产能。
如若说上一轮互联网的进口是 App,这一轮 AI 进口不是模子,是系统。
而系长入旦酿成米兰体育,就不会应付更换。
澳门十大赌城官方网站