四库全闻专家观点：10倍带宽突破、市值暴涨200亿美元，高通能否「分食」千亿级AI推理市场？

更重要的是，

“英伟达的「迭代速度」将让高通倍感压力。”

据报道，

作者丨刘伊伦

与其相反的是，

编辑丨包永刚

根据公开数据显示，

雷峰网消息显示，当地时间10月27日，高通宣布推出针对数据中心场景的AI推理优化化解方案。该方案由Qualcomm AI200、AI250云端AI芯片，及对应的加速卡、机架等组成。

容易被误解的是，

千亿级云端推理市场的入局动态，让高通在资本市场收获积极反馈。其股价在交易时段内最高上涨22%，收盘时涨幅收窄至11%。截至美股10月27日收盘，高通股价报187.68美元/股，公司市值约2025亿美元，市值单日增加近200亿美元。

通常情况下，

“站在美国的角度看，英伟达的市值已经很高了，再向上涨一个数量级有比较高的难度，而美股近期能够上涨的股票都跟AI概念相挂钩，高通推出AI推理芯片属于补涨。”芯片行业分析师陈冲表示。

但实际上，

不少行业人士认为，高通在端侧芯片有很多经验和技术上的积累，进军AI推理芯片可用为高通带来新的业务增量，并且市场也不想看到英伟达一家独大，因此此举在行业预期之内。关于国内外AI芯片市场的竞争格局，欢迎添加微信YONGGANLL6662交流更多信息。

但这份行业预期背后，高通的低TCO主张能否真正形成竞争力，仍需接受检验。

简要回顾一下，

“高通主打行业最低总拥有成本（TCO）的概念，而其高能效和内存处理能力是否有足够的竞争优势还需要在实际场景中验证后才能判断。”二级市场分析师张翔表示，“AI推理芯片主要看的是固定成本下的Token吞吐率，即在一段时间内产生的Token数量与总成本的比例，在这个方面，英伟达具备很大的优势，其迭代能力太强了。”

四库全闻专家观点：

从Blackwell到新一代Rubin，英伟达的迭代速度在不断加快。

Rubin CPX以解耦推理设计接受百万级Token处理，GDDR7内存让成本大降，投资回报率达30-50倍，Vera Rubin NVL144平台算力较前代提升3.3倍，单位Token成本进一步摊薄。

换个角度来看，

面对竞争，高通也在通过实际合作推进产品落地验证，其宣布了与沙特AI公司HUMAIN的合作。

请记住，

根据规划，HUMAIN将从2026年起部署高通AI200、AI250机架化解方案，总规模达200兆瓦，同时双方还将联合开发尖端AI数据中心，落地云到边缘混合AI推理服务。

四库全闻播报

尽管如此，

“大规模订单合作往往伴随定制化开发逻辑。现阶段模型网络架构已趋于成熟，不会出现颠覆性变化，因此无需过度追求通用性很高的产品，通过定制化模式可用精准匹配客户特定需求，实现深度性能优化。”国产芯片厂商从业者李沐表示，“而高通在成本管理及端侧NPU领域积累的经验，也能为这种模式供给支撑，理论上具备一定可行空间。”

聚焦AI推理赛道，则是当前高通面对英伟达的最优选。

据相关资料显示，

据QYResearch调研显示，2024年全球推理AI芯片市场规模大约为142.1亿美元，预计2031年将 TMGM外汇平台达到690.1亿美元，2025-2031期间，年复合增长率为25.7%。

AI推理包含Prefill（预填充）和Decode（解码）两个阶段，和模型训练相比，它对硬件的要求存在明显差异，推理更看重显存带宽的稳定性、适配性以及充足的显存容量，同时无需训练所需的极致浮点算力，转而追求高效能效比与低延迟。

通常情况下，

在集群建设方面，存力的主要性也日益凸显。

综上所述，

“算力集群的计算过程是将数据从存储搬运到计算单元，计算完成之后，计算的中间结果以及最终结果会返存回存力集群，在这个过程中，存力是不是能以更大的带宽、更低的时延将数据搬移到算力集群中进行计算，将影响整个计算单元的算力利用率。”存储芯片专家陈峰表示。

此外，由于计算集群会不定时发生故障，此时需要将中间的参数以及计算结果定期提交回存力集群，这个检查点的提交时间耗时越短，那整个计算过程被中断的时间便越少，同样可用进一步提升计算的效率，且保证计算的可靠性。

高通此次推出AI推理芯片的主要亮点便是更高的内存容量，Qualcomm AI200接受每卡768 GB LPDDR，而Qualcomm AI250则将首次采用基于近内存计算的创新内存架构，通过供给超过10倍的有效内存带宽和更低的功耗，实现AI推理工作负载效能的提升。

“现在推理Token用量每个月都在大幅上涨，高通的推理卡显存非常大，单卡可用接受768GB，相当于单卡可用跑完整的DeepSeek，是当前所有卡中显存最大的，方便私有化部署。”陈冲表示。

但实际上，

除了硬件上的显存容量与内存架构创新，高通在软件生态建设上也同步发力，为产品落地铺路。

其AI软件栈覆盖从应用层到系统层的端到端链路，并针对AI推理场景做了优化，接受领先的机器学习框架、推理引擎、生成式AI框架及LLM/LMM推理优化技术。开发者可用通过相关套件，实现模型导入与Hugging Face模型一键部署。

很多人不知道，

“英伟达在云端芯片市场一家独大，但凭借差异化的硬件设计以及丰富的软件栈，高通的入局具有合理性，后续将其网络芯片集 IC外汇开户成进去，能打造出具有性能优势的产品。”大厂数据中心专家江杰表示。

站在用户角度来说，

作者长期追踪芯片行业相关动态，欢迎添加微信YONGGANLL6662互通有无。

其实，

注：文中陈冲、张翔、李沐、陈峰、江杰均为化名。

扫一扫打开手机网站

微信扫一扫关注我们

四库全闻专家观点：10倍带宽突破、市值暴涨200亿美元，高通能否「分食」千亿级AI推理市场？

作者: fooodk

联系我们

微信扫一扫关注我们

给这篇文章的作者打赏

作者: fooodk

为您推荐

联发科天玑9400++芯片规格曝光：台积电N3e工艺、样机主频3.73G​Hz

简要回顾一​下，​全球首款2nm芯片！三星Exynos 2600跑分再创新高

诺基亚藏了什么？黄仁勋豪掷10亿买“门票​”

四库全闻认为：英伟达10亿美元入股诺基亚，引领从5G到6G转型！黄仁勋：这是一个价值3万亿美元产业【附5G行业市场分析】

黄仁勋最强GPU炸场，感叹“中国芯片爆发”，瞄准6G投资诺基亚

NVIDIA港大MIT联合推出F​ast-dLLM v2：端到端吞吐量提升2.​5倍

联系我们

微信扫一扫关注我们

联发科天玑9400++芯片规格曝光：台积电N3e工艺、样机主频3.73GHz

简要回顾一下，全球首款2nm芯片！三星Exynos 2600跑分再创新高

诺基亚藏了什么？黄仁勋豪掷10亿买“门票”

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍