-
作者
-
發佈日期
2026-06-01
-
閱讀時間
7分鐘
-
字體大小
NVIDIA 行政總裁黃仁勳 6 月 1 日在 GTC Taipei 2026 主題演講中,正式介紹全新 NVIDIA Vera CPU 處理器。他強調,過去的 CPU 是為人類所設計,而 Vera CPU 則是專為 AI 代理(Agentic AI)時代而生的處理器 。



AI 代理對速度的極致渴求
黃仁勳解釋,AI 代理與人類不同,它們非常「缺乏耐心」,其運作的世界是以納秒(nanoseconds)為單位計算 。當 AI 代理使用工具或存取資料庫時,需要系統盡快給出回應 。AI 代理每一刻的等待,都會阻礙其進入下一個運算步驟 。因此 CPU 的低延遲與高互動性至關重要 。NVIDIA 從頭重建架構,打造出 Vera CPU 來專門應對這類工作負載 。


核心技術突破與效能表現
NVIDIA Vera CPU 在單執行緒效能(Single-threaded performance)以及內部傳輸頻寬上皆達到了世界級的水準 。為了讓讀者更直觀了解 Vera 的技術突破,以下整理了其核心規格與效能數據:
與 Rubin GPU 深度整合的 AI 工廠
Vera CPU 並非單獨運作,而是 NVIDIA Vera Rubin 系統的核心樞紐。在 Vera Rubin 機架中,已內建了兩顆 CPU 用於協調 GPU、管理 KV 快取(KV cache)以及處理機架內執行的軟件 。此外 NVIDIA 也推出了專屬的 Vera CPU 機架,單一液冷機架內可容納 256 顆 CPU ,專門負責協調模型、調度記憶體與啟動工具 。
透過具備記憶體一致性的 NVLink-C2C(Chip-to-chip)技術,GPU 能直接連接到系統傳輸網路 。官方資料亦指出其互連技術能實現每秒 1.8 TB 的數據傳輸,是 PCIe Gen 6 的 7 倍,整個機架可同時運行逾 22,500 個獨立運算環境。目前 Alibaba、Meta、Oracle Cloud Infrastructure 及 CoreWeave 等主要雲端服務供應商已宣布部署計劃。

市場定位與生態系統
AI 時代的經濟基礎是「Token」的生成 。黃仁勳坦言,Vera CPU 及儲存伺服器位處資料中心最關鍵、也是最昂貴的路徑上,因為這正是產生經濟價值與 Token 的所在 。為了實現利潤最大化,Vera CPU 具備極高的能源效率,讓營運商能在不排擠 Token 生成電力的前提下,於 AI 工廠中部署盡可能多的 CPU 。

目前 Vera Rubin 已進入全面量產階段 ,預計將成為 NVIDIA 史上擴張最快、最成功的新產品線 ,並於今年下半年透過合作夥伴正式出貨。