Intel喊了三年的 AI PC，黄仁勋一来就把桌子给掀了

今天黄仁勋在台北掏了一颗芯片出来，整个PC行业都炸了。

这颗芯片叫RTX Spark。里面塞了20个CPU核心、6144个CUDA核心、最高128GB的统一内存。我翻译一下，就是一台不到三斤重、14毫米厚的笔记本，可以在不联网的情况下，本地跑1200亿参数的大模型，支持100万token的上下文。所有数据不出你这台机器。

黄仁勋的原话是这么说的。四十年了，你们打开应用、点鼠标、敲键盘。从今天开始，你开口说话，电脑干活。

他给这东西起了个新名字，叫Personal AI Computer。不是AI PC，是个人AI电脑。名字都得跟别人不一样。

有意思的是，你回想一下这两年，所有人都在聊AI和PC。Intel最早喊AI PC，AMD后来喊Agent Computer，高通跟微软一起推Copilot+ PC，苹果虽然嘴上没喊什么口号，但每场发布会张口闭口都是M系列芯片的AI有多猛。

所有人说的好像是同一件事，但你仔细一听，又完全不是同一件事。

所以今天我想跟你聊聊，这些家伙各自到底在干什么，有什么区别。

Intel：最早推广"AI PC"的人，也是最保守的人

先说清楚一个事。AI PC这个词到底是谁搞出来的。

2023年9月，Intel的CEO Pat Gelsinger在一个开发者大会上第一次系统性推广这个概念。说实话，当时大部分人都没听懂。PC能跑AI了？我十年前就能用Siri了，那是不是早就是AI PC了。

但Intel是认真的。两个月后，他们拿出了第一代Core Ultra处理器，代号Meteor Lake。这颗芯片最大的变化，是Intel第一次往处理器里塞了一个叫NPU的东西。

NPU的全名叫神经网络处理单元。你不用记这个词，你只要知道它是一颗专门干AI活的小发动机就行了。CPU负责通用运算，GPU管图形，NPU专门管AI实时背景虚化这种事。

然后Intel就一代代往上叠。2024年9月的Lunar Lake，NPU提到48 TOPS，每秒48万亿次运算，刚刚好够到微软给Copilot+ PC划的及格线。再后来是2026年1月的Panther Lake，总平台AI算力做到180 TOPS。

听着都不错吧。但问题在哪呢。

不管叠了多少代，Intel的底层逻辑从来没变过。x86还是x86，PC还是那台PC，AI只是挂在上面的一个加速器。你用电脑的方式没有任何变化，还是双击图标、点鼠标、敲键盘。AI帮你P个图可以，帮你降个噪也行。但AI是AI，电脑是电脑。它是功能，不是电脑本身。

说实话，Intel最早把这个概念喊响了，但它是五家里做得最保守的。

AMD：方向对了，但被软件卡住了

AMD的路线比Intel有意思得多。

起步阶段AMD也是走CPU旁边挂NPU的老路。2024年的Ryzen AI 300系列，Zen 5的CPU加RDNA 3.5的GPU加50 TOPS的NPU，本质上还是Intel那套。

但到了2025年，AMD搞出了一个叫Strix Halo的东西，后来的正式名字是Ryzen AI Max 300。这颗芯片干了件传统PC芯片从来没干过的事。

它把CPU和GPU的内存合到一起了。

传统PC的架构是这样的。CPU有自己的系统内存，16GB或者32GB的DDR5。GPU有自己的独立显存，8GB或者12GB的GDDR6。跑AI模型的时候，数据先加载到系统内存，再拷贝到显存里，算完了再拷回来。光是中间搬来搬去，就是一笔很大的延迟和功耗开销。

Strix Halo做了128GB的统一内存。CPU和GPU共享同一块物理内存池，数据不用搬。根据目前泄露的信息，后续的Gorgon Halo可能进一步把统一内存推到更高容量。同时AMD还发了一台叫Ryzen AI Halo的开发者小主机，3999美元，今年6月预购。

AMD看到了正确的方向。他们知道统一内存是跑大模型的关键，也知道传统PC的分离式内存架构在AI时代是个致命的瓶颈。

但是AMD有一个绕不过去的硬伤。

软件。

AMD的AI软件栈叫ROCm。我知道你不想听技术名词，但有一点你记住就行。全世界的AI开发者都在一个叫CUDA的平台上写代码，这个平台是NVIDIA的。市面上几乎所有主流AI框架，PyTorch、TensorFlow、vLLM这些，都是给CUDA写的。ROCm就是AMD试图复刻一个CUDA出来，但稳定性和兼容性差了不止一个档次。

做AI开发的人可以接受硬件比NVIDIA慢一点，但接受不了软件三天两头给你报莫名其妙的错。

高通：第一个冲Windows on Arm的，背了一身包袱

高通进PC市场的历史比你想的久。2017年他们就搞过第一代Snapdragon笔记本，结果惨不忍睹，性能不行、软件不兼容、厂商也不配合。

但高通没放弃。2023年10月，他们掏出了Snapdragon X Elite，这颗芯片终于让人觉得高通是认真的了。

X Elite用上了高通自己设计的Oryon CPU核心，NPU做到45 TOPS。最关键的是，它拿到了微软的全面站台。微软把它作为首批Copilot+ PC的核心平台，Surface Pro 11用的就是它。

到2024年，Windows上支持高通芯片的原生Arm应用超过750个。到2025年，高通把Snapdragon X塞进了600美元价位段。再往后，X2 Elite升级到3nm，NPU干到80 TOPS。

高通的底子其实很好。它做手机芯片出身，天生就懂SoC集成加NPU加低功耗这一套。一台Snapdragon X笔记本可以无风扇、多天续航，这一点它最接近苹果的水平。

但高通有两个解不开的死结。

第一是Windows on Arm的兼容性问题。比几年前是好多了，但大量老应用、行业软件、游戏还是x86原生的，需要靠模拟翻译才能跑。模拟就是有性能损耗，有奇怪的bug。Laptop Mag 有位作者在长期使用 Windows on Arm 后说，“我在 2024 年 3 月撰写了一篇关于 Windows on Arm 的长期评测，里面每有一个优点，我都要强调一个缺点。”。

第二个死结是AI生态。高通的NPU确实做到了80 TOPS，在传统PC芯片里最强。但高通的AI软件栈跟CUDA、跟ROCm、跟苹果的Core ML完全不在一个世界里。它的NPU本质上只能跑高通自己优化过的模型和微软给Copilot+订制的几个功能。对普通AI开发者来说，它的使用门槛高、通用性弱，远不如CUDA那样成为主流AI开发入口。

一句话，高通的NPU很强，但它是给PC加的AI功能，不是让AI开发者用PC。

苹果：从没说过这四个字，但做得最彻底

现在轮到最讽刺的一家了。

苹果从2020年发布M1到现在，一次都没说过AI PC四个字。但你如果回头看苹果这六年的芯片路线，你会发现每一台Mac就是一台AI PC，只是他们从来没这么叫过。

我快速过一遍。

M1是2020年11月出来的。16核的神经网络引擎，每秒11万亿次AI运算。更重要的是，CPU和GPU共享统一内存，一块物理内存池，不需要数据搬来搬去。从硬件角度看，这已经是一台标准的AI PC了，当时只是没人往那个方向想。

M2是2022年的。神经网络引擎干到15.8万亿次。M2 Ultra可以配192GB的统一内存，带宽800GB每秒。一台桌面电脑给你塞192GB的统一内存，这个配置到今天大部分AI开发者的工作站都做不到。

M3是2023年的。第一个用上3nm工艺的PC芯片。

M4是2024年的。神经网络引擎到38万亿次。

M5是2025年10月的。苹果在这颗芯片上干了一件很狠的事，他们在GPU的每一个计算核心里都塞了一个专用的AI加速器。算下来，M5的GPU AI算力是M1的六倍。

M5 Max是2026年3月出的。128GB统一内存，带宽614GB每秒，40个GPU核心。

苹果这套硬件，做AI的条件好到什么程度。好到一台M2 Ultra的Mac Studio可以本地跑700亿参数的大模型，而且一整个模型都在统一内存里，零数据搬运。这件事Intel、AMD、高通三家至今没能在消费级产品上实现。

那有个很自然的问题。苹果硬件这么强，为什么AI圈子的开发者还在买NVIDIA。

因为软件。苹果有Core ML和MLX，但这两样东西只活在苹果自己的园子里。全世界的AI模型、框架、工具链，是在NVIDIA的CUDA上长出来的。一个AI工程师到了苹果的Mac上，会发现他日常用的大部分工具链不是不兼容，就是性能和稳定性天差地别。

苹果的处境可以这样讲。它建了全世界最漂亮的AI硬件跑道，但没人把车开上来。

NVIDIA RTX Spark：他们不是来做PC的

好了，前面四家讲清楚了，现在我们来看今天的主角。

在你知道了Intel、AMD、高通、苹果各自在干什么之后，RTX Spark到底有多不一样，其实就很好理解了。

先说硬件的部分。

顶配版叫N1X，基础版叫N1。N1X的核心是20个Arm CPU核心，其中10个高性能核加10个能效核，CPU是和联发科一起设计的。GPU是Blackwell架构，6144个CUDA核心。128GB LPDDR5X统一内存，资料显示内存带宽约300GB每秒，GPU和CPU之间通过NVLink C2C互联，带宽最高600GB每秒。FP4精度下AI算力1000 TOPS。台积电3nm工艺，总共700亿个晶体管。

GPU的性能大概等于一台笔记本版RTX 5070的水平。

你把这些数字跟前面对比一下就知道差距在哪了。Intel和高通的AI PC，NPU算力大概在50到80 TOPS这个区间。而RTX Spark是1000 TOPS。这不是同一个量级的东西，差了一个零还不止。这里要说明一下，Intel和高通那个数字是NPU的算力，NVIDIA这个是GPU的算力。但关键是，RTX Spark本质上就是用一整个GPU来跑AI的，而不是往CPU旁边挂一个NPU。

128GB统一内存意味着它可以本地离线跑1200亿参数的大模型。Intel和高通的AI PC只能跑十几亿参数的小模型做点辅助功能。AMD的Strix Halo系列也能跑大参数模型，但它的软件生态是ROCm，跟CUDA没法比。

说到软件，这才是NVIDIA真正杀人的地方。

RTX Spark上面跑的是完整的CUDA生态。全世界的AI框架原生支持CUDA，代码从笔记本迁移到数据中心GPU上，一行不用改。这也是为什么微软会拉着NVIDIA一起做新的Windows安全框架，也是为什么Adobe会专门为RTX Spark重新架构Photoshop和Premiere。不是因为NVIDIA的CPU更快，是因为这些公司里的AI功能，早就在CUDA上跑了不知道多少年了。

现在你应该能理解黄仁勋为什么敢说那话了。你不再打开应用，你开口说话。他不是在吹牛，他是在描述一个全新的交互逻辑。RTX Spark想做的事情不是让你的电脑能跑几个AI功能，而是让一个AI agent长期活在你的电脑上，帮你干活。你说话，它执行。

当然，它也不是没有短处。

WCCFTech在报道里直接点了一个尴尬的事情。工程样机的Geekbench跑分，没打过苹果三年前发布的M3 Max。CPU单核性能确实不是它的强项。

另外36氪的分析也提了几个很现实的问题。Windows on Arm的应用兼容性问题该有的一个都不会少。这么高规格的SoC塞进14毫米厚笔记本里，散热怎么搞。价格大概率也不便宜，DGX Spark从最初宣布的3999美元涨到后来实际卖的4699美元，这条定价路径已经说明了很多。

还有一个容易被忽略的事。NVIDIA以前从来没大规模出货过笔记本SoC。跟消费级OEM打交道的方式、功耗调优的经验、整个售后体系，这些都需要从头建。

但有一件事比所有这些技术指标都重要。

AInvest的分析师Victor Hale写了段话我觉得特别好。他说RTX Spark根本不是一个PC产品，它是一个推理分发漏斗。NVIDIA在数据中心训练市场用CUDA建了一道很宽的护城河，但这道护城河在推理市场会变窄，因为推理比的是谁能省电、谁延迟低、谁每生成一个token更便宜。所以NVIDIA想了个办法，让在RTX Spark笔记本上写代码的AI开发者，顺手把模型部署到NVIDIA的数据中心GPU上去。笔记本是入口，数据中心是收银台。

说白了，NVIDIA来做PC芯片，不是为了抢PC市场那几百亿美元的肉。它是为了让全世界的AI开发者都从CUDA这条管道里走。

结尾

说到这里，你应该能看出这五家到底在干什么了。

Intel、AMD、高通是一种答案。PC还是那台PC，AI是往上加的功能。你该怎么用电脑还怎么用，AI帮你省点力。

苹果是第二种答案。PC从头到脚都是为AI做的硬件，但AI是用来让App更好用的，不改变你跟电脑交互的方式。你还是在点图标，开应用，敲键盘。

NVIDIA是第三种答案。AI不附着在PC上，AI本身就是PC。一个AI agent住在你的电脑里，你说话，它干活。

三种答案，指向同一个方向。PC和AI的边界在消失。只是有人站着走过去，有人小跑，有人直接跳了过去。

而且NVIDIA这还不是一锤子买卖。按照WCCFTech和Tom's Hardware挖到的消息，NVIDIA已经公开了RTX Spark后面两代产品的路线图。2027年的Vera Rubin Spark，和更后面的Rosa Feynman Spark，全部支持LPDDR6内存。Tom's Hardware的原话是，NVIDIA这是要花三四代产品的时间，把Windows on Arm整个重塑一遍。

但话说回来，我最期待看到的反而不是什么跑分数据。而是今年秋天，第一批RTX Spark笔记本上市的时候，一个普通人把它打开，开机。然后他想了想，到底是像过去四十年一样，点开一个应用，敲键盘。还是直接开口，让电脑来干活。

那个瞬间，可能才是AI PC真正诞生的时刻。

如果觉得内容不错，欢迎你点一下「在看」，或是将文章分享给其他有需要的人^^

相关好文推荐：

每次看见有人说能够识别出一段文字是不是AI生成的，我都忍不住想笑

一种快速判别产品AI含量的黄金指标，帮你远离披着AI外皮的传统软件公司

飞书会取代微信吗？

AI 时代的软件与软件公司应该长什么样？

引入嵌套学习（Nested Learning）：一种用于持续学习的全新机器学习范式

如何构建多智能体研究系统