官方网站-首页官方网站-首页

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

2025-09-10 09:30:47 292

【导语】9月10日,英伟达重磅推出专为大规模上下文处理设计的专用GPU——Rubin CPX,其独立GPU显存达128GB,具备超强计算与注意力能力,将作为Vera Rubin平台一部分于2026年底面世,英伟达称其将为客户带来高效回报。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

  9 月 10 日消息,英伟达宣布推出新产品Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

  该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。

  该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能

  从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含128GB 的 GDDR7 显存。英伟达承诺,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。

  英伟达 CEO 黄仁勋将(jiāng) Rubin CPX 与(yǔ) RTX 进(jìn)行(xíng)了(le)比(bǐ)较(jiào),他(tā)说(shuō):“正(zhèng)如(rú) RTX 革(gé)新(xīn)了(le)图(tú)形(xíng)和(hé)物(wù)理(lǐ) AI,Rubin CPX 是(shì)首(shǒu)款(kuǎn)专(zhuān)为(wèi)大(dà)规(guī)模(mó)上(shàng)下(xià)文 AI 设(shè)计(jì)的(de) CUDA GPU,能(néng)够(gòu)在(zài)同(tóng)一(yī)时(shí)间(jiān)推(tuī)理(lǐ)跨(kuà)越(yuè)数(shù)百(bǎi)万(wàn)个(gè)知(zhī)识(shi)符(fú)号(hào)的(de)模(mó)型(xíng)。”他(tā)还(hái)试(shì)图(tú)量(liàng)化(huà)客(kè)户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

  英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。

  英伟达表示,预计 Rubin CPX 将于2026 年底推出