Theo dõi từ Động Sát Beating, trong bài phát biểu tại GTC Taipei 2026, Jensen Huang đã dành nhiều nội dung để giới thiệu triết lý thiết kế của CPU Vera. Ông chỉ ra rằng trước đây mọi CPU đều được thiết kế cho con người, thế giới tương tác của con người tính bằng giây, CPU đám mây được cho thuê theo số lõi. Nhưng thế giới của Agent tính bằng nano giây: mỗi lần gọi công cụ, truy cập cơ sở dữ liệu, Agent đều yêu cầu phản hồi nhanh nhất, bất kỳ sự chờ đợi nào cũng sẽ chặn bước suy luận tiếp theo. "Trước đây chúng ta tạo CPU cho 1 tỷ con người, tương lai sẽ tạo CPU cho hàng tỷ Agent."
Ông đã tóm tắt bốn trụ cột thiết kế của CPU Vera. Thứ nhất, hiệu suất đơn luồng (IPC) cao nhất toàn cầu: mỗi chu kỳ xung nhịp có thể hoàn thành việc lấy lệnh, giải mã và thực thi 10 lệnh, vì Agent cần độ trễ cực thấp thay vì thông lượng truyền thống. Thứ hai, băng thông mỗi lõi đạt chuẩn hàng đầu thế giới. Thứ ba, băng thông tổng thể trong chip vượt giới hạn: kiến trúc kết nối hoàn toàn mới kết nối tất cả lõi CPU với tốc độ ánh sáng, băng thông mặt cắt ngang đạt 3,6 TB/s, không có ranh giới chiplet, không có chi phí xuyên chip, tất cả lõi phối hợp làm việc thay vì cho thuê theo lõi. Thứ tư, hiệu suất năng lượng tối ưu: triển khai càng nhiều CPU càng tốt mà không chiếm dụng điện năng sinh token của GPU.
CPU Vera đồng thời lập nhiều kỷ lục đầu tiên trong ngành: CPU đầu tiên trên thế giới hỗ trợ PCIe Gen 6, bộ xử lý máy chủ đầu tiên trang bị bộ nhớ LPDDR5 và đạt băng thông 1,2 TB/s (gấp 2 đến 3 lần so với CPU x86 hiệu suất cao nhất hiện tại). Jensen Huang cho biết, ngành CPU có thể đạt mức cải thiện 5% đã đáng kinh ngạc, 10% càng hiếm thấy, nhưng khoảng cách hiệu suất của CPU Vera so với x86 mạnh nhất là "một cấp độ chưa từng thấy".
Ông cũng tiết lộ rằng NVIDIA đã bán được hàng triệu CPU Grace (dòng Grace Blackwell) và hiện là một trong những nhà sản xuất CPU lớn nhất thế giới. CPU Vera đảm nhận ba vai trò trong hệ thống: điều phối GPU và quản lý bộ đệm KV trong khung máy Vera Rubin NVL72; hoạt động như lớp harness của Agent để chạy điều phối mô hình, gọi công cụ và truy cập cơ sở dữ liệu; và trong hệ thống lưu trữ Vera BlueField, điều khiển máy chủ lưu trữ AI nhanh nhất thế giới.
