2026世界杯你的位置:米兰体育官方网站 > 2026世界杯 > 米兰体育 谷歌讲了一个英伟达不擅长的故事
米兰体育 谷歌讲了一个英伟达不擅长的故事

发布日期:2026-04-25 22:38    点击次数:190

  

米兰体育 谷歌讲了一个英伟达不擅长的故事

文 | 版面以外,作家|版君

英伟达和谷歌,两场大会,两个东谈主,说了归并个词。

3 月 16 日,圣何塞,GTC 2026。黄仁勋把数据中心界说为 " 出产 Token 的工场 ",并给出一个惊东谈主的判断,到 2027 年,这个市集的需求界限至少 1 万亿好意思元。

4 月 22 日,拉斯维加斯,Google Cloud Next 2026。桑达尔 · 皮查伊给出另一组数字:谷歌每分钟处理 160 亿个 token,上个季度照旧 100 亿。本大哥本开支 1750 亿到 1850 亿好意思元。

两个东谈主都在谈 Token。但一个在描画供给,一个在展示破钞。

当年很长一段期间,外界风俗性地把谷歌放在追逐者的位置。

这个判断,正在失效。

把这两场大会放在一齐看,会发现一个更关节的变化:这不是归并场竞争。

一、卖铲子的,和造工场的

默契这两家公司,先要看清它们各安宁卖什么。

英伟达的家具,是出产云尔。

GPU 是通用算力,从 OpenAI 到 Meta,从字节朝上到主权基金,确切通盘头部 AI 玩家,都在它的客户名单里。

CUDA 生态麇集超 600 万众人开采者、900 余个 CUDA-X 加快库,二十年接续迭代的生态飞轮,早已成为 AI 时间算力底层的法子件。

黄仁勋那句判断很有代表性:即便竞争敌手的架构是免费的,也偶而足够低廉。

2025 财年,NVIDIA 数据中心业务收入高出 1150 亿好意思元,同比增长高出 200%,毛利率在 75% 以上,在众人 AI 加快器市集占据约 80% 的份额。

换句话说,每 10 块 AI 算力芯片里,至少有 8 块来自英伟达。

这是一门典型的卖铲子的交易,并且是通盘东谈主都离不开的那种。

谷歌的旅途完全不同,它提供的不是单一器用,而是一整套运行体系。

自研 TPU 芯片、检修 Gemini 模子、运行在 Cloud 之上,再对外提供处事。从底层算力到表层利用,全部买通。

咫尺 Google 云业务年收入已接近 600 亿好意思元,当年一年增长接近 50%,AI 相干需求成为最中枢的驱能源。

这种形状更像是我方搭建了一座圆善的工场,再把饱和的产能对外输出。

英伟达的逻辑,是把缔造卖给通盘东谈主。谷歌的旅途,则是先把体系跑起来,再让别东谈主接入。

一个掌执出产云尔,一个在组织出产经由。

二、TPU 一刀切两半

此次谷歌 Cloud Next,TPU 最值得隆重的变化,不在参数,而在结构。

从 2017 年 TPU v2 起至 2025 年 v7 Ironwood,整整六代家具,谷歌持久经受单颗通用芯片同期承载大模子检修与推理任务。

直到此次发布第八代 TPU,谷歌初度透彻策略转向,将检修、推理拆分为两颗专属独处芯片(TPU 8t、TPU 8i)。

分家的原因很成功,Agent 时间,推理和检修的负载特征完全不同。

一个智能体完成任务,频频需要屡次调用模子,每一次调用都条款低蔓延、高并发。这和检修阶段的采集算力需求完全不同。

一颗芯片同期跑检修和推理,哪头都拼凑,哪头都不够好。

背后的算账逻辑很明晰。检修是一次性参加,模子训好就行。推理是接续性破钞,用户每用一次就推理一次。

当 token 界限从 100 亿 / 分钟跃升到 160 亿 / 分钟,推理端的效果运转成功决定成本结构。

这也解释了两家公司时候旅途的各异。英伟达接续优化单颗芯片性能,谷歌更热心集群效果与举座成本。

三、Anthropic 的一百万颗芯片

TPU 从里面器用走向外部市集,有一个较着的象征,运转承载头部模子公司的中枢负载。

2025 年 10 月,Anthropic 与谷歌签了一份多年期契约,最多使用 100 万颗 Ironwood TPU,价值数百亿好意思元。

这是 AI 历史上最大的单笔算力往来。

紧接着,Meta 传出正在推敲从 2027 年起部署 TPU。音尘一出,英伟达股价今日大跌。

这一系列动作,对英伟达来说,米兰体育官方网站是最危机的信号。不是某个小公司在试水,是 Anthropic,是 Meta,众人头部的大模子公司,都要把自家最中枢的推理负载全部押在了 TPU 上。

谷歌的策略很明确:用 Anthropic 和 Meta 作念样板客户,证明注解 TPU 能替代英伟达,然后通过 Cloud 平台把 TPU 算力卖给通盘企业。

如若说英伟达的上风在软件生态,CUDA 酿成了强绑定。谷歌的冲突口,则来自成本。

Ironwood TPU 的核神思算是显赫裁减总领有成本。精密分析显露,其每好意思元性能 / 价钱比较前代晋升 2 倍,比拟 NVIDIA B200 在总领有成本上具有约 30%~41% 的上风,可有用匡助企业铁心推理成本。

当推理成本被压到敌手的一半以下,软件壁垒就运转松动了。因为企业算账的时候,省下来的钱足够遮蔽迁徙成本。

时候壁垒依然存在,但经济驱动运转改革选拔。

四、160 亿 token 背后的实话

皮查伊在 Cloud Next 上说了三个数字:160 亿 token 每分钟。75% 的新代码由 AI 生成。本年参加 1750 亿到 1850 亿好意思元。

看起来漫步,其实指向归并件事。

这些 token,不仅仅 API 调用,还包括搜索、告白、YouTube 推选、安全系统和里面开采。

从 100 亿到 160 亿,单季度增长高出 60%,按这个界限估算,谷歌每天处理的 token 依然达到万亿级。

算作对比,刻下头部模子公司的 API 调用,约莫处在数百亿到千亿 token/ 天的区间。

谷歌的体量,依然超出单一模子公司的限制,更接近一个基础法子级消费体。

这和黄仁勋建议的 "Token 工场 ",酿成了一个故事理的对照。

黄仁勋描画的是一个卖方市集。Token 是商品,GPU 是出产缔造,价钱分五个层级,从免费到 150 好意思元每百万 token。你来买缔造,出产 Token,卖给你的客户。

他在 GTC 上连 Token 的订价体系都替行业联想好了。

英伟达围绕供给侧构建体系,谷歌则在放大需求侧界限。

一个界说产能,一个吞下产能。而持久来看,需求会反过来塑造供给。

谷歌对 TPU 性价比的优化能源,远超任何外部客户,因为每裁减一分钱的推理成本,省下来的钱领先进了我方的口袋。本体上,谷歌我方即是全天下最大的 Token 消费者。

五、谁会赢?

短期看,英伟达赢。CUDA 生态的壁垒、80% 的市集份额、75% 以上的毛利率,这些不会整夜被颠覆。

黄仁勋直言,到 2027 年英伟达将迎来至少 1 万亿好意思元的细则性算力需求;其中 60% 来自众人前五大超大界限云厂商,剩余 40% 漫步于企业荒谬部署、主权云、角落计议及全行业场景。

这份预判,有着王人备的底气。

但谷歌正在把竞争拉到英伟达不擅长的维度。

此次 Cloud Next 上,GE 在谷歌的 Agent 平台上跑了高出 800 个智能体,遮蔽制造、物流和供应链。毕马威首月部署高出 100 个智能体,90% 的职工在用。默克签了 10 亿好意思元合同。

谷歌云 CEO 库里安还阐述,基于 Gemini 构建的苹果新一代 Siri 将于本年发布,相助每年价值约 10 亿好意思元。

当企业客户的需求从一块 GPU 变成了帮我管住一千个 Agent,卖芯片的就比不外卖系统的了。

英伟达处治的是有莫得算力,谷歌要处治的是算力怎么被用起来。

这不是谁杀死谁的故事。就像石油行业既有卖钻头的哈里伯顿,也有我方钻井、真金不怕火葬、零卖一条龙的沙特阿好意思。两种形状会持久共存。

但有一件事正在发生变化。

当年,英伟达是通盘东谈主的唯独选拔。当今,谷歌证明注解了另一条路走得通。Anthropic 选了 TPU,Meta 在推敲 TPU,苹果把 Siri 交给了谷歌 Gemini。

选拔变多了。对把持者来说,这即是最大的威逼。

ChatGPT 出来后的两年多,谷歌看起来像一个追逐者。但 Cloud Next 讲了一个不同的故事,谷歌莫得赢模子竞赛,但它把 AI 再行变回了一个基础法子问题。

而作念基础法子,偶合是谷歌最擅长的事。

谷歌不是在追英伟达,也并非念念在芯片战场击败英伟达。

从一运转,它们跑的就不是归并场比赛。

【版面以外】的话:

AI 的上半场,是检修模子。下半场,是管千里着冷静能体。结尾,可能是铁心系统。

黄仁勋说 Token 是新的大量商品。皮查伊说谷歌每分钟破钞 160 亿个。一个在界说市集,一个在吃下产能。

如若说上一轮互联网的进口是 App,这一轮 AI 进口不是模子,是系统。

而系长入旦酿成米兰体育,就不会应付更换。

澳门十大赌城官方网站

Copyright © 1998-2026 米兰体育官方网站™版权所有

zzyfdj.com 备案号 备案号: 豫ICP备11004128号-1

技术支持:®米兰体育  RSS地图 HTML地图