Intel喊了三年的 AI PC,黄仁勋一来就把桌子给掀了

今天黄仁勋在台北掏了一颗芯片出来,整个PC行业都炸了。

这颗芯片叫RTX Spark。里面塞了20个CPU核心、6144个CUDA核心、最高128GB的统一内存。我翻译一下,就是一台不到三斤重、14毫米厚的笔记本,可以在不联网的情况下,本地跑1200亿参数的大模型,支持100万token的上下文。所有数据不出你这台机器。

黄仁勋的原话是这么说的。四十年了,你们打开应用、点鼠标、敲键盘。从今天开始,你开口说话,电脑干活。

他给这东西起了个新名字,叫Personal AI Computer。不是AI PC,是个人AI电脑。名字都得跟别人不一样。

有意思的是,你回想一下这两年,所有人都在聊AI和PC。Intel最早喊AI PC,AMD后来喊Agent Computer,高通跟微软一起推Copilot+ PC,苹果虽然嘴上没喊什么口号,但每场发布会张口闭口都是M系列芯片的AI有多猛。

所有人说的好像是同一件事,但你仔细一听,又完全不是同一件事。

所以今天我想跟你聊聊,这些家伙各自到底在干什么,有什么区别。

Intel:最早推广"AI PC"的人,也是最保守的人

先说清楚一个事。AI PC这个词到底是谁搞出来的。

2023年9月,Intel的CEO Pat Gelsinger在一个开发者大会上第一次系统性推广这个概念。说实话,当时大部分人都没听懂。PC能跑AI了?我十年前就能用Siri了,那是不是早就是AI PC了。

但Intel是认真的。两个月后,他们拿出了第一代Core Ultra处理器,代号Meteor Lake。这颗芯片最大的变化,是Intel第一次往处理器里塞了一个叫NPU的东西。

NPU的全名叫神经网络处理单元。你不用记这个词,你只要知道它是一颗专门干AI活的小发动机就行了。CPU负责通用运算,GPU管图形,NPU专门管AI实时背景虚化这种事。

然后Intel就一代代往上叠。2024年9月的Lunar Lake,NPU提到48 TOPS,每秒48万亿次运算,刚刚好够到微软给Copilot+ PC划的及格线。再后来是2026年1月的Panther Lake,总平台AI算力做到180 TOPS。

听着都不错吧。但问题在哪呢。

不管叠了多少代,Intel的底层逻辑从来没变过。x86还是x86,PC还是那台PC,AI只是挂在上面的一个加速器。你用电脑的方式没有任何变化,还是双击图标、点鼠标、敲键盘。AI帮你P个图可以,帮你降个噪也行。但AI是AI,电脑是电脑。它是功能,不是电脑本身。

说实话,Intel最早把这个概念喊响了,但它是五家里做得最保守的。

AMD:方向对了,但被软件卡住了

AMD的路线比Intel有意思得多。

起步阶段AMD也是走CPU旁边挂NPU的老路。2024年的Ryzen AI 300系列,Zen 5的CPU加RDNA 3.5的GPU加50 TOPS的NPU,本质上还是Intel那套。

但到了2025年,AMD搞出了一个叫Strix Halo的东西,后来的正式名字是Ryzen AI Max 300。这颗芯片干了件传统PC芯片从来没干过的事。

它把CPU和GPU的内存合到一起了。

传统PC的架构是这样的。CPU有自己的系统内存,16GB或者32GB的DDR5。GPU有自己的独立显存,8GB或者12GB的GDDR6。跑AI模型的时候,数据先加载到系统内存,再拷贝到显存里,算完了再拷回来。光是中间搬来搬去,就是一笔很大的延迟和功耗开销。

Strix Halo做了128GB的统一内存。CPU和GPU共享同一块物理内存池,数据不用搬。根据目前泄露的信息,后续的Gorgon Halo可能进一步把统一内存推到更高容量。同时AMD还发了一台叫Ryzen AI Halo的开发者小主机,3999美元,今年6月预购。

AMD看到了正确的方向。他们知道统一内存是跑大模型的关键,也知道传统PC的分离式内存架构在AI时代是个致命的瓶颈。

但是AMD有一个绕不过去的硬伤。

软件。

AMD的AI软件栈叫ROCm。我知道你不想听技术名词,但有一点你记住就行。全世界的AI开发者都在一个叫CUDA的平台上写代码,这个平台是NVIDIA的。市面上几乎所有主流AI框架,PyTorch、TensorFlow、vLLM这些,都是给CUDA写的。ROCm就是AMD试图复刻一个CUDA出来,但稳定性和兼容性差了不止一个档次。

做AI开发的人可以接受硬件比NVIDIA慢一点,但接受不了软件三天两头给你报莫名其妙的错。

高通:第一个冲Windows on Arm的,背了一身包袱

高通进PC市场的历史比你想的久。2017年他们就搞过第一代Snapdragon笔记本,结果惨不忍睹,性能不行、软件不兼容、厂商也不配合。

但高通没放弃。2023年10月,他们掏出了Snapdragon X Elite,这颗芯片终于让人觉得高通是认真的了。

X Elite用上了高通自己设计的Oryon CPU核心,NPU做到45 TOPS。最关键的是,它拿到了微软的全面站台。微软把它作为首批Copilot+ PC的核心平台,Surface Pro 11用的就是它。

到2024年,Windows上支持高通芯片的原生Arm应用超过750个。到2025年,高通把Snapdragon X塞进了600美元价位段。再往后,X2 Elite升级到3nm,NPU干到80 TOPS。

高通的底子其实很好。它做手机芯片出身,天生就懂SoC集成加NPU加低功耗这一套。一台Snapdragon X笔记本可以无风扇、多天续航,这一点它最接近苹果的水平。

但高通有两个解不开的死结。

第一是Windows on Arm的兼容性问题。比几年前是好多了,但大量老应用、行业软件、游戏还是x86原生的,需要靠模拟翻译才能跑。模拟就是有性能损耗,有奇怪的bug。Laptop Mag 有位作者在长期使用 Windows on Arm 后说,“我在 2024 年 3 月撰写了一篇关于 Windows on Arm 的长期评测,里面每有一个优点,我都要强调一个缺点。”。

第二个死结是AI生态。高通的NPU确实做到了80 TOPS,在传统PC芯片里最强。但高通的AI软件栈跟CUDA、跟ROCm、跟苹果的Core ML完全不在一个世界里。它的NPU本质上只能跑高通自己优化过的模型和微软给Copilot+订制的几个功能。对普通AI开发者来说,它的使用门槛高、通用性弱,远不如CUDA那样成为主流AI开发入口。

一句话,高通的NPU很强,但它是给PC加的AI功能,不是让AI开发者用PC。

苹果:从没说过这四个字,但做得最彻底

现在轮到最讽刺的一家了。

苹果从2020年发布M1到现在,一次都没说过AI PC四个字。但你如果回头看苹果这六年的芯片路线,你会发现每一台Mac就是一台AI PC,只是他们从来没这么叫过。

我快速过一遍。

M1是2020年11月出来的。16核的神经网络引擎,每秒11万亿次AI运算。更重要的是,CPU和GPU共享统一内存,一块物理内存池,不需要数据搬来搬去。从硬件角度看,这已经是一台标准的AI PC了,当时只是没人往那个方向想。

M2是2022年的。神经网络引擎干到15.8万亿次。M2 Ultra可以配192GB的统一内存,带宽800GB每秒。一台桌面电脑给你塞192GB的统一内存,这个配置到今天大部分AI开发者的工作站都做不到。

M3是2023年的。第一个用上3nm工艺的PC芯片。

M4是2024年的。神经网络引擎到38万亿次。

M5是2025年10月的。苹果在这颗芯片上干了一件很狠的事,他们在GPU的每一个计算核心里都塞了一个专用的AI加速器。算下来,M5的GPU AI算力是M1的六倍。

M5 Max是2026年3月出的。128GB统一内存,带宽614GB每秒,40个GPU核心。

苹果这套硬件,做AI的条件好到什么程度。好到一台M2 Ultra的Mac Studio可以本地跑700亿参数的大模型,而且一整个模型都在统一内存里,零数据搬运。这件事Intel、AMD、高通三家至今没能在消费级产品上实现。

那有个很自然的问题。苹果硬件这么强,为什么AI圈子的开发者还在买NVIDIA。

因为软件。苹果有Core ML和MLX,但这两样东西只活在苹果自己的园子里。全世界的AI模型、框架、工具链,是在NVIDIA的CUDA上长出来的。一个AI工程师到了苹果的Mac上,会发现他日常用的大部分工具链不是不兼容,就是性能和稳定性天差地别。

苹果的处境可以这样讲。它建了全世界最漂亮的AI硬件跑道,但没人把车开上来。

NVIDIA RTX Spark:他们不是来做PC的

好了,前面四家讲清楚了,现在我们来看今天的主角。

在你知道了Intel、AMD、高通、苹果各自在干什么之后,RTX Spark到底有多不一样,其实就很好理解了。

先说硬件的部分。

顶配版叫N1X,基础版叫N1。N1X的核心是20个Arm CPU核心,其中10个高性能核加10个能效核,CPU是和联发科一起设计的。GPU是Blackwell架构,6144个CUDA核心。128GB LPDDR5X统一内存,资料显示内存带宽约300GB每秒,GPU和CPU之间通过NVLink C2C互联,带宽最高600GB每秒。FP4精度下AI算力1000 TOPS。台积电3nm工艺,总共700亿个晶体管。

GPU的性能大概等于一台笔记本版RTX 5070的水平。

你把这些数字跟前面对比一下就知道差距在哪了。Intel和高通的AI PC,NPU算力大概在50到80 TOPS这个区间。而RTX Spark是1000 TOPS。这不是同一个量级的东西,差了一个零还不止。这里要说明一下,Intel和高通那个数字是NPU的算力,NVIDIA这个是GPU的算力。但关键是,RTX Spark本质上就是用一整个GPU来跑AI的,而不是往CPU旁边挂一个NPU。

128GB统一内存意味着它可以本地离线跑1200亿参数的大模型。Intel和高通的AI PC只能跑十几亿参数的小模型做点辅助功能。AMD的Strix Halo系列也能跑大参数模型,但它的软件生态是ROCm,跟CUDA没法比。

说到软件,这才是NVIDIA真正杀人的地方。

RTX Spark上面跑的是完整的CUDA生态。全世界的AI框架原生支持CUDA,代码从笔记本迁移到数据中心GPU上,一行不用改。这也是为什么微软会拉着NVIDIA一起做新的Windows安全框架,也是为什么Adobe会专门为RTX Spark重新架构Photoshop和Premiere。不是因为NVIDIA的CPU更快,是因为这些公司里的AI功能,早就在CUDA上跑了不知道多少年了。

现在你应该能理解黄仁勋为什么敢说那话了。你不再打开应用,你开口说话。他不是在吹牛,他是在描述一个全新的交互逻辑。RTX Spark想做的事情不是让你的电脑能跑几个AI功能,而是让一个AI agent长期活在你的电脑上,帮你干活。你说话,它执行。

当然,它也不是没有短处。

WCCFTech在报道里直接点了一个尴尬的事情。工程样机的Geekbench跑分,没打过苹果三年前发布的M3 Max。CPU单核性能确实不是它的强项。

另外36氪的分析也提了几个很现实的问题。Windows on Arm的应用兼容性问题该有的一个都不会少。这么高规格的SoC塞进14毫米厚笔记本里,散热怎么搞。价格大概率也不便宜,DGX Spark从最初宣布的3999美元涨到后来实际卖的4699美元,这条定价路径已经说明了很多。

还有一个容易被忽略的事。NVIDIA以前从来没大规模出货过笔记本SoC。跟消费级OEM打交道的方式、功耗调优的经验、整个售后体系,这些都需要从头建。

但有一件事比所有这些技术指标都重要。

AInvest的分析师Victor Hale写了段话我觉得特别好。他说RTX Spark根本不是一个PC产品,它是一个推理分发漏斗。NVIDIA在数据中心训练市场用CUDA建了一道很宽的护城河,但这道护城河在推理市场会变窄,因为推理比的是谁能省电、谁延迟低、谁每生成一个token更便宜。所以NVIDIA想了个办法,让在RTX Spark笔记本上写代码的AI开发者,顺手把模型部署到NVIDIA的数据中心GPU上去。笔记本是入口,数据中心是收银台。

说白了,NVIDIA来做PC芯片,不是为了抢PC市场那几百亿美元的肉。它是为了让全世界的AI开发者都从CUDA这条管道里走。

结尾

说到这里,你应该能看出这五家到底在干什么了。

Intel、AMD、高通是一种答案。PC还是那台PC,AI是往上加的功能。你该怎么用电脑还怎么用,AI帮你省点力。

苹果是第二种答案。PC从头到脚都是为AI做的硬件,但AI是用来让App更好用的,不改变你跟电脑交互的方式。你还是在点图标,开应用,敲键盘。

NVIDIA是第三种答案。AI不附着在PC上,AI本身就是PC。一个AI agent住在你的电脑里,你说话,它干活。

三种答案,指向同一个方向。PC和AI的边界在消失。只是有人站着走过去,有人小跑,有人直接跳了过去。

而且NVIDIA这还不是一锤子买卖。按照WCCFTech和Tom's Hardware挖到的消息,NVIDIA已经公开了RTX Spark后面两代产品的路线图。2027年的Vera Rubin Spark,和更后面的Rosa Feynman Spark,全部支持LPDDR6内存。Tom's Hardware的原话是,NVIDIA这是要花三四代产品的时间,把Windows on Arm整个重塑一遍。

但话说回来,我最期待看到的反而不是什么跑分数据。而是今年秋天,第一批RTX Spark笔记本上市的时候,一个普通人把它打开,开机。然后他想了想,到底是像过去四十年一样,点开一个应用,敲键盘。还是直接开口,让电脑来干活。

那个瞬间,可能才是AI PC真正诞生的时刻。

如果觉得内容不错,欢迎你点一下「在看」,或是将文章分享给其他有需要的人^^

相关好文推荐:

每次看见有人说能够识别出一段文字是不是AI生成的,我都忍不住想笑

一种快速判别产品AI含量的黄金指标,帮你远离披着AI外皮的传统软件公司

飞书会取代微信吗?

AI 时代的软件与软件公司应该长什么样?

引入嵌套学习(Nested Learning):一种用于持续学习的全新机器学习范式

如何构建多智能体研究系统

0条留言

留言