动态公司新闻

公司新闻客户案例

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

2025-09-10 09:30:47 292

【导语】9月10日，英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX，其独立GPU显存达128GB，具备超强计算与注意力能力，将作为Vera Rubin平台一部分于2026年底面世，英伟达称其将为客户带来高效回报。

　　9 月 10 日消息，英伟达宣布推出新产品Rubin CPX，这是一款专为大规模上下文处理而设计的专用 GPU，涵盖了像大规模编码和生成视频这样要求高的工作。

　　该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开，英伟达表示，这将使整个过程对客户的效率更高。

　　该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作，该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。

　　从英伟达新闻稿获悉，独立的 Rubin CPX GPU 包含128GB 的 GDDR7 显存。英伟达承诺，新硬件具有 3 倍的 attention capabilities，并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。

　　英伟达 CEO 黄仁勋将(jiāng) Rubin CPX 与(yǔ) RTX 进(jìn)行(xíng)了(le)比(bǐ)较(jiào)，他(tā)说(shuō)：“正(zhèng)如(rú) RTX 革(gé)新(xīn)了(le)图(tú)形(xíng)和(hé)物(wù)理(lǐ) AI，Rubin CPX 是(shì)首(shǒu)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下(xià)文 AI 设(shè)计(jì)的(de) CUDA GPU，能(néng)够(gòu)在(zài)同(tóng)一(yī)时(shí)间(jiān)推(tuī)理(lǐ)跨(kuà)越(yuè)数(shù)百(bǎi)万(wàn)个(gè)知(zhī)识(shi)符(fú)号(hào)的(de)模(mó)型(xíng)。”他(tā)还(hái)试(shì)图(tú)量(liàng)化(huà)客(kè)户的投资回报，提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

　　英伟达表示，该硬件将得到其完整软件栈的支持，包括 Nemotron —— 其一系列开放的多模态模型，专为构建企业级 AI 代理（旨在自主处理复杂任务的系统）而设计。Nemotron 模型提供不同尺寸，从 Nano 用于设备端应用，到 Super 用于单 GPU 设置，再到 Ultra 用于大型数据中心。

　　英伟达表示，预计 Rubin CPX 将于2026 年底推出。

微信公众号搜索“ 新能源 ”加关注，最新环卫前沿洞察、企业动态、产品公告全面了解。推荐关注!

【微信扫描下方二维码可直接关注】

上一篇：半年13亿、海外暴增899%！中国玩具巨头靠什么在海外“杀疯”？下一篇：中国移动灵犀智能体产品族全面落地荣耀 AI 手机

官方网站-首页

官方网站-首页

关于

>about

官方网站-首页

产品中心

>Product Center

官方网站-首页

应用场景

>Application Scenarios

官方网站-首页

动态

>News center

官方网站-首页

运营平台

>Operation platform

官方网站-首页

合作模式

>

官方网站-首页

售后服务

>after-sale service

官方网站-首页

联系我们

>

官方网站-首页

官方网站-首页

首款专为大规模上下文 AI 设计的 CUDA GPU，英伟达 Rubin CPX 发布

【微信扫描下方二维码可直接关注】

官方网站-首页

为美好出行续航

快速充电，随时满电出行～

咨询电话

021-63658255

售后服务热线

0731-85697750

E-mail：com@hejunbaojie.com