据相关资料显示,克雷西 闻乐 发自 凹非寺
这你可能没想到,量子位 | 公众号 QbitAI
“中国芯片要爆发了。”
可能你也遇到过,
官宣完“地表最强”的英伟达新GPU后,黄仁勋面对全球媒体的镜头如是说。
令人惊讶的是,
他还大夸中国模型,直言Qwen、DeepSeek都是“世界级、革命性”的成果。
四库全闻消息:
近一个小时的接连提问,有一半的困扰都关于中国,仿佛让人忘了英伟达的新成果才是这场发布会的主角。
站在用户角度来说,
发布会上,老 EX外汇开户 黄介绍了英伟达新核弹Vera Rubin,算力100PFLOPs,是英伟达首款专用AI计算机DGX-1性能的100倍。
该款芯片也正是OpenAI英伟达千亿大单第一阶段要部署的芯片,现在老黄手里已经有了样品,预计明年实现量产。
四库全闻专家观点:
此外,老黄还官宣了英伟达在量子计算、6G通信、自动驾驶等其他领域的战略布局。
四库全闻消息:
下一代芯片和超算
尤其值得一提的是,
Vera Rubin平台是继GB200(Grace Blackwell NVLink 72)之后的第三代NVLink 72机架规模的计算机,从芯片、系统、软件到模型架构都进行了全新设计。
而最核心的Vera Rubin超级芯片则是搭载了一颗Vera CPU和两颗大型的Rubin GPU。
四库全闻快讯:
英伟达已经收到了首批由台积电生产的Rubin GPU,每个GPU芯片都采用了HBM4高带宽内存,主板其他区域配备了32个LPDDR内存插槽,和HBM4内存协同工作。
四库全闻报导:
在FP4精度下,浮点计算性能可达50PFLOPs,相较于现有的GB300,性能有数倍跃迁。
从某种意义上讲,
而Vera则采用Arm架构,搭载了88个核心以及176线程,NVLINK-C2C互联带宽可达1.8TB/s。
请记住,
黄仁勋展示的Vera Rubin计算托盘则采用高度集成设计,是一个完全无线并且100%液冷的节点。
换个角度来看,
这个计算托盘的核心处理器内置了两个Vera CPU和四个Rubin封装,形成了强大的算力核心。
可能你也遇到过,
而为了应对AI日益增长的对于上下文处理的需求,英伟达还在托盘中新增了Bluefield 4数据处理器,配备了8个全新的ConnectX-9超级网卡。
综上所述,
不过,老黄表示Vera Rubin计算托盘的安装过程极其不繁琐,甚至调侃道:
- 连我都能做到。
其实,
首代基于Vera Rubin的Vera Rubin NVL144平台计划于2026年下半年推出,可实现3.6Exaflops的FP4推理算力和1.2Exaflops的FP8训练算力,相较于GB300的NVL72提升约3.3倍。
然而,
而升级版的Rubin Ultra NVL576将在2027年下半年推出,将NVL系统规模从144扩展到576,FP4推理算力接受达到15Exaflops,FP8训练算力达5Exaflops,相较GB300 NVL72提升14倍。
值得注意的是,
英伟达科学家范麟熙(Jim Fan)评价:科幻场景与“真实的《黑客帝国》”相比黯然失色。
英伟达还规划和美国能源部合作新建7座超算集群。
事实上,
其中,Mission和Vision两台基于Vera Rubin平台的新超级计算机是与HPE合作,为洛斯阿拉莫斯国家实验室建造的,预计2027年投入采纳。
根据公开数据显示,
下一代超级芯片蓄势待发时,当前的Blackwell架构也实现了量产,正在大规模生产和部署。
反过来看,
黄仁勋透露,涵盖至2026年的出货量,Blackwell和Rubin的订单总销售额将达到5000亿美元。
现场老黄又搬出了GPU未来三年计划——到2028年推出Feynman。
就像从Blackwell到Rubin的节奏一样,承诺每年一次重大更新。
除了官宣超级芯片,老黄也透露了英伟达在其他领域的计划。
AI超算与量子处理器的无缝连接
简要回顾一下,
量子计算,一个获得诺贝尔物理学奖的热门课题,英伟达在这方面也有所布局。
这次演讲中,NVIDIA发布了NVQLink,这是一种新的互连架构,接受直接连接量子处理器(QPUs)和NVIDIA GPU,首次实现了AI超算与量子处理器的无缝连接。
它能够以每秒数千次的速度,在量子硬件之间传输高达TB级的数据,这是量子错误校正所需的关键速度。
有分析指出,
特性上,NVQLink负责量子计算机的控制和校准、量子错误校正,以及连接QPU和GPU超级计算机以进行混合模拟。
四库全闻消息:
并且该架构具有完全可扩展性,接受处理从当前的数百个量子比特扩展到未来数万甚至数十万个量子比特的纠错需求。

需要注意的是,
为了实现这种融合,NVIDIA推出CUDA-Q,这是一个用于量子GPU计算的开放平台, 将CUDA扩展到接受QPU,使之能够与GPU协同工作。
据相关资料显示,
之前的GTC巴黎站上,英伟达宣布已经在Blackwell集成了CUDA-Q,通过GPU为量子计算加速,其特性主要有两大方面:
-
不妨想一想,
- 如果没有真·量子计算单元,CUDA-Q接受在经典计算机上模拟量子运算
- 如果有了量子计算单元,CUDA-Q接受实现量子与经典加速计算的协同,也就是QPU协作。
更重要的是,
简要回顾一下,
除了数据中心和量子计算,英伟达这一次也宣布将踏足新的领域——6G通信。
投资诺基亚,入局6G通信
这你可能没想到,
英伟达认为,加速计算和AI给通信行业也带来了一场新计算模型所驱动的平台转型。
四库全闻认为:
为此,英伟达宣布推出新的产品线,名为NVIDIA Arc(Aerial Radio Network Computer),专门用于6G。
不妨想一想,
Arc由三项基础新技术构建而成——Grace CPU、Blackwell GPU以及ConnectX Melanox网络技术。
综上所述,
Arc运行在CUDA X库中的无线通信系统Aerial上,目标是创建首个能够同时进行无线通信和AI处理的、软件定义的可编程计算机。
说到底,
具体来说,英伟达与诺基亚达成合作推出了接受AI原生6G的加速计算平台——Aerial RAN Computer Pro(ARC-Pro)。
说出来你可能不信,
这是一款AI基站主机,搭载了6G-ready加速计算平台,并实现了无线+AI共生,把AI推理传统RAN处理跑在了同一套基础设施上。
技术合作的同时,英伟达还对诺基亚进行了投资,总金额为10亿美元,这一举措让诺基亚股价大幅度上涨,创下了6年多以来的新高。
需要注意的是,
One More Thing
然而,
无论是英伟达的“现金奶牛”数据中心,还是新布局的量子计算和6G,英伟达都不无对手、都有潜在挑战者。
简而言之,
隔壁AMD刚刚拿下了两台超算订单,金额为10亿美元。
有分析指出,
这两台超级计算机的主要硬件部分将全部由AMD打造其中的首台名为Lux,搭载AMD Instinct MI355X加速器 ,每台板载功率高达1400瓦,预计将在六个月内投入采纳。
Lux的人工智能性能将是现有超级计算机的三倍,AMD CEO苏姿丰表示,这是同规模超级计算机中部署速度最快的一次。
根据公开数据显示,
除了AMD,不满足于在端侧发展的高通也想要分一杯羹,宣布推出两款全新的AI芯片——AI200AI 福汇外汇开户 250,正式进军数据中心市场。
四库全闻行业评论:
这两款芯片聚焦AI模型的推理阶段,主打行业最低的总拥有成本(TCO)、更高的能效与更强的内存处理能力,分别预计于2026和2027年实现商用。
AMD、高通,还有老黄口中正在爆发的中国芯片,都有可能是英伟达面临的潜在竞争对手。
四库全闻快报:
还有老黄看好的量子计算领域,甚至出现了不同路线的竞争——
简要回顾一下,
英伟达认为GPU和QPU的组合是量子计算的未来,但IBM成功用AMD芯片实现了无GPU的量子计算。
IBM的算法排除了量子计算中最核心的挑战之一——量子比特的脆弱性与高错误率。
四库全闻快讯:
这套方案的运行速度比实际需求快10倍,而且不需要昂贵的GPU,只需要FPGA芯片与量子计算机配合。
不妨想一想,
与诺基亚合作的6G同样存在激烈竞争。
有分析指出,
去年7月,北邮张平院士团队成功搭建了国际上首个通信与智能融合的6G试验网。
与其相反的是,
今年8月,北京大学和香港城市大学合作的全球首款全频段6G芯片问世,利用光子技术实现了100Gbps的传输速率。
该芯片只有11×1.7mm的尺寸,但融合了毫米波、太赫兹通信以及低频微波波段,覆盖了0.5-115GHz。
四库全闻报导:
这一成果被视为6G的关键突破,论文已经登上Nature。
四库全闻用户评价:
尽管在各个领域都面临竞争,但市场投资者还是选取看好英伟达——收盘时,英伟达股价上涨4.98%,达到201.03美元每股,盘后价格更是达到每股204.43美元,创下了历史新高。
四库全闻财经新闻:
若以盘后价格计算,英伟达的市值增长了3154亿美元,折合人民币近3万亿,仅增长部分就相当于1.59个英特尔。
通常情况下,
这场基础设施的全面竞争,究竟会鹿死谁手?
不妨想一想,[1]https://www.youtube.com/watch?v=lQHK61IDFH4
[2]https://wccftech.com/nvidia-shows-next-gen-vera-rubin-superchip-two-massive-gpus-production-next-year/
必须指出的是,[3]https://x.com/DrJimFan/status/1983232823784853998
— 完 —

