Hội nghị GTC 2026 của NVIDIA đã khai mạc hôm nay tại San Jose, California, Hoa Kỳ, diễn ra từ ngày 16 đến 19 tháng 3. Hơn 30.000 nhà phát triển, nhà nghiên cứu và đại diện doanh nghiệp từ 190 quốc gia sẽ tham dự, với hơn 1000 cuộc họp được tổ chức.
Trước đó, hội nghị đã phát đi nhiều tín hiệu quan trọng: NVIDIA đang tích hợp công nghệ Groq mà họ đã mua vào dòng sản phẩm của mình; Samsung sẽ lần đầu tiên hoàn thành việc sản xuất chip AI cho NVIDIA; đồng thời, OpenAI có cơ hội trở thành một trong những khách hàng đầu tiên của NVIDIA cho thế hệ chip lý trí mới. Chuỗi các hành động này cho thấy NVIDIA đang mở rộng từ vị thế thống trị chip AI huấn luyện sang thị trường chip lý trí và thông qua việc đa dạng hóa chuỗi cung ứng để giảm sự phụ thuộc vào TSMC.
Trong năm nay, hội nghị cũng thiết lập khu vực trải nghiệm độc quyền OpenClaw mang tên "Build-a-Claw". Các tham dự viên có thể tùy chỉnh và triển khai một AI agent có khả năng hoạt động bền vững dưới sự hướng dẫn của các kỹ sư NVIDIA.
Là một trong những nền tảng ra mắt công nghệ quan trọng hàng năm của ngành công nghiệp AI, Tổng giám đốc điều hành NVIDIA Jensen Huang đã phát biểu vào lúc 2 giờ sáng ngày 17 tháng 3 theo giờ Bắc Kinh, toàn văn xem tại: "Toàn văn diễn văn GTC của Jensen Huang: Nhu cầu thị trường năm 2027 sẽ vượt qua 10 nghìn tỷ đô la; Mọi người nên đề ra chiến lược OpenClaw". Nhóm giám sát AI của BlockBeats 1M AI News sẽ cập nhật thông tin nóng và chính xác về hội nghị, dưới đây là tin tức mới nhất:
Theo giám sát từ 1M AI News, NVIDIA đã công bố một loạt sản phẩm AI vật lý mới tại Hội nghị GTC và hợp tác với các công ty lớn trong hệ sinh thái robot toàn cầu, nhà tiên phong trong robot hình người và nhà sản xuất robot phẫu thuật. Jensen Huang cho biết "AI vật lý đã đến, mỗi doanh nghiệp công nghiệp sẽ trở thành một công ty robot".
Sản phẩm cốt lõi được công bố:
1. Cosmos 3: Mô hình cơ sở thế giới tổng hợp đầu tiên kết hợp sinh thái tạo ra, suy luận thị giác và mô phỏng hành động, được sử dụng để tăng tốc việc phát triển trí tuệ tổng quát của robot trong môi trường phức tạp
2. Isaac Lab 3.0: Phiên bản Truy cập Sớm, hỗ trợ Học Máy lớn mạnh trên cơ sở hạ tầng DGX, dựa trên Bộ Vật lý Newton Engine 1.0 hoàn toàn mới và được xây dựng trên SDK PhysX, thêm hỗ trợ Mô Phỏng Đa Vật Lý và kiểm soát Khéo léo phức tạp
3. GR00T N1.7: Phiên bản Truy cập Sớm, đi kèm với Giấy phép Thương mại, cung cấp Kiểm soát Khéo léo cao cấp cho triển khai Robot sản xuất hàng loạt và các kỹ năng chung khác
4. GR00T N2 (Xem trước): Dựa trên nghiên cứu DreamZero, mô hình cơ bản của Robot thế hệ tiếp theo, sử dụng Kiến trúc Mô hình Hành động Thế giới hoàn toàn mới, tỷ lệ thành công trong nhiệm vụ mới và môi trường mới cao hơn gấp đôi so với mô hình Hành động Ngôn ngữ thị giác chính thống, hiện đang xếp hạng hàng đầu trên bảng xếp hạng MolmoSpaces và RoboArena, dự kiến sẽ phát hành trước cuối năm
Đối với Robot Công nghiệp, FANUC, ABB Robotics, YASKAWA và KUKA với hơn 2 triệu máy đã được triển khai trên toàn cầu đều tích hợp Thư viện Omniverse và Khung mô phỏng Isaac vào giải pháp điều chỉnh ảo, đồng thời tích hợp Mô-đun Jetson vào Bộ điều khiển cho Trí tuệ Nhân tạo tai chốt. Đối với Robot Hình người, các công ty như 1X, AGIBOT, Agility, Boston Dynamics, Figure đều đang sử dụng Cosmos, Isaac Sim và Isaac Lab để tăng tốc nghiên cứu phát triển. Đối với Robot Y tế, CMR Surgical sử dụng Cosmos-H để mô phỏng huấn luyện Hệ thống Phẫu thuật Versius của họ, Johnson & Johnson Medical sử dụng Isaac Sim và Cosmos sau đó để huấn luyện quy trình làm việc của Hệ thống Niệu đạo Monarch, Medtronic đang khám phá IGX Thor để cung cấp An toàn chức năng cho hệ thống Robot Phẫu thuật
Một trong những điểm nổi bật của hội nghị đến từ Disney: Disney sử dụng Bộ mô phỏng Vật lý GPU được tăng tốc bằng GPU dựa trên cấu trúc Warp của NVIDIA và tích hợp vào Newton Physics Engine Kamino, huấn luyện chiến lược vận động cho nhân vật Robot Olaf và BDX, giúp Olaf học cách quản lý nhiệt độ cơ thể của bản thân và giảm tiếng ồn va chạm. Hugh Jackman xuất hiện cùng với Robot Olaf trong bài diễn văn chủ đề, Olaf sẽ chính thức xuất hiện lần đầu vào ngày 29 tháng 3 tại Công viên Disneyland Paris.
Theo giám sát từ Tin tức 1 triệu AI, NVIDIA đã công bố mở rộng gia đình mô hình mở Nemotron 3, bổ sung ba mô hình đa phương tiện dành cho Đại lý Trí tuệ Nhân tạo:
1. Nemotron 3 Ultra: Định vị trí tuệ cấp đầu, đạt hiệu suất xử lý gấp 5 trên nền tảng Blackwell trong định dạng NVFP4, dành cho các kịch bản hỗ trợ lập trình, tìm kiếm và tự động hóa quy trình làm việc phức tạp
2. Nemotron 3 Omni: Kết hợp khả năng âm thanh, thị giác và hiểu ngôn ngữ, có khả năng trích xuất thông tin hiệu quả từ video và tài liệu
3. Nemotron 3 VoiceChat: Hỗ trợ cuộc trò chuyện trực tiếp, trí tuệ nhân tạo có thể lắng nghe và phản hồi đồng thời, tích hợp Tự động chuyển văn bản thành tiếng nói (ASR), xử lý mô hình ngôn ngữ lớn và tổng hợp tiếng nói (TTS) trong một hệ thống duy nhất
Ngoài ra, NVIDIA cũng đã phát hành mô hình bảo mật Nemotron và đường ống truy xuất Agent, mô hình đầu tiên phát hiện nội dung không an toàn trong văn bản và hình ảnh, và đường ống truy xuất Agent cải thiện tính liên quan và độ chính xác của đầu ra Agent. Hơn nữa, vào ngày 11 tháng này, NVIDIA đã tiên phát hành Nemotron 3 Siêu, một mô hình Mamba-Transformer MoE kết hợp với 1200 tỷ tham số (120 tỷ tham số hoạt động), hỗ trợ gốc cho cửa sổ ngữ cảnh 100 triệu token, tăng hiệu suất xử lý hơn 5 lần so với thế hệ trước, đạt được điểm số 85,6% trên bài kiểm tra chuẩn OpenClaw Agent PinchBench và trở thành mô hình mở hàng đầu trong cùng loại.
Các công ty như CodeRabbit, CrowdStrike, Công cụ lập trình AI Cursor, Factory, ServiceNow và Công cụ tìm kiếm AI Perplexity đã triển khai mô hình Nemotron cho ứng dụng Agent. Nền tảng nghiên cứu AI Edison Scientific đã tích hợp Nemotron vào khoa học gia trí AI tự nhiên Kosmos của mình, phục vụ hơn 50.000 nhà nghiên cứu, có thể thực hiện hàng trăm nhiệm vụ nghiên cứu song song, theo thông tin chính thức từ họ, có thể làm giảm thời gian nghiên cứu hàng tháng xuống chỉ trong một ngày.
Theo dõi từ 1M AI News, NVIDIA đã công bố gia nhập lĩnh vực tính toán vũ trụ, ra mắt mô-đun Space-1 Vera Rubin, được thiết kế đặc biệt cho trung tâm dữ liệu trên quỹ đạo, tích hợp 2 GPU Rubin và 1 CPU Vera, sức mạnh suy luận trí tuệ nhân tạo có thể lên đến 25 lần so với H100, giúp các mô hình ngôn ngữ lớn và cơ sở có thể chạy trực tiếp trên quỹ đạo.
황 인훈은 말했다: "우주 컴퓨팅, 최후의 전선, 이미 와 있습니다. 인공지능은 위성 거대망의 배치와 심층 우주 탐사의 추진과 함께 데이터가 생성되는 곳에 존재해야 합니다." 그는 또한 우주 열 방출이 해결되지 않은 기술적 도전 과제라고 고백했습니다: "우주에는 열전달도 없고 대류도 없고 방사만 있기 때문에, 우리는 우주에서 이러한 시스템을 어떻게 냉각할지 알아내어야 합니다."
Space-1 모듈은 크기, 무게 및 전력이 제한된 환경을 대상으로 설계되었으며, 궤도 상 자체 분석, 실시간 데이터 처리 및 과학적 발견을 지원합니다. 최초의 파트너는 우주 태양 에너지 회사 Aetherflux, 비공개 우주 정거장 개발 업체 Axiom Space, 위성 통신 회사 Kepler Communications, 지구 관측 회사 Planet Labs, Sophia Space 및 클라우드 컴퓨팅 위성 회사 Starcloud를 포함합니다. 구체적인 상장 일정은 아직 공개되지 않았습니다.
1M AI News가 보도한 바에 따르면, NVIDIA는 GTC 컨퍼런스에서 Agent Toolkit 오픈 플랫폼을 발표했으며, 핵심 구성품은 오픈소스 안전런타임인 OpenShell로, 자체 운영 AI 에이전트에 정책 기반 보안, 네트워크 및 개인 정보 보호 장벽을 제공합니다. 황 인훈은 발표에서 다음과 같이 말했습니다: "Claude Code와 OpenClaw는 에이전트 전환점을 촉발시킴으로써 인공지능을 생성 및 추론에서 행동으로 확장했습니다. 직원들은 최첨단, 전문 및 맞춤형 에이전트 팀에 의해 강화될 것이며, 기업 소프트웨어 산업은 전문화된 에이전트 플랫폼으로 진화할 것이며, IT 산업은 다음 대규모 확장 지점에 있습니다."
Agent Toolkit에는 LangChain과 공동으로 개발한 오픈소스 AI-Q Blueprint도 포함되어 있으며, 선도적인 모델이 배치 및 Nemotron 열린 모델 연구에 대한 혼합 아키텍처를 책임지며, 질의 비용을 50% 이상 절감할 수 있습니다. NVIDIA가 개발한 AI-Q Blueprint을 사용한 에이전트는 현재 DeepResearch Bench 및 DeepResearch Bench II 두 목록에서 모두 1위를 차지하고 있습니다.
보안 측면에서, NVIDIA는 Cisco, CrowdStrike, Google, Microsoft Security 및 TrendAI와 협력하여 OpenShell을 네트워크 보안 및 인공지능 보안 도구와 호환되게 하고 있습니다. CrowdStrike는 "Design AI Blueprint"를 동시에 공개하였으며, Falcon 플랫폼의 보호 기능을 직접 NVIDIA AI Agent 아키텍처에 통합하였습니다.
17 Nhà Sản xuất Nền tảng Phần mềm đã kết nối với Agent Toolkit: Adobe, Amdocs, Atlassian, Box, Cadence, Cisco, Cohesity, CrowdStrike, Dassault Systèmes, IQVIA, Palantir, Red Hat, SAP, Salesforce, Siemens, ServiceNow và Synopsys. Trong đó, Salesforce sẽ chạy Agentforce Agent với Slack làm giao diện chính và lớp chỉ đạo, Siemens đã phát hành Agent AI EDA Fuse dựa trên Nemotron cho tự động hóa quy trình thiết kế chip và PCB.
Theo dõi từ 1M AI News, Groq 3 LPU (Đơn vị Xử lý Ngôn ngữ) là chip đầu tiên của NVIDIA sau việc mua lại công ty khởi nghiệp chip Reasoning AI Groq với khoảng 20 tỷ USD vào tháng 12 năm ngoái, dự kiến bắt đầu giao hàng vào quý 3 năm nay. Khung Groq 3 LPX có thể chứa 256 viên LPU, trang bị 128GB SRAM trên chip và băng thông kết nối mở rộng 640TB/giây. NVIDIA cho biết khi triển khai LPX với Vera Rubin NVL72, hiệu suất xử lý Reasoning cao nhất mỗi Megawatt có thể tăng lên tới 35 lần, đồng thời mở khóa tiềm năng doanh thu cho triển khai hàng nghìn tỷ tham số, triển khai thông tin ngữ cảnh triệu mã. Huang Renxun mô tả hai vi điều khiển này như "cực đoan nhưng thống nhất; một mục tiêu cao suất xử lý, một mục tiêu thấp độ trễ, bộ nhớ trên chip của LPX mở rộng đáng kể dung lượng bộ nhớ tổng cộng mà mô hình có thể sử dụng. Kế hoạch cho vi xử lý LPX dự kiến sẽ ra mắt vào nửa cuối năm nay cùng với nền tảng Vera Rubin.
Tại hội nghị, Huang Renxun cũng giới thiệu mẫu cấu trúc khung trạm thế hệ tiếp theo mang mã Kyber. Kyber sẽ biến đổi khay tính toán GPU 144 viên từ chiều ngang sang chiều dọc, để tăng mật độ vật lý và giảm độ trễ, sẽ triển khai trên nền tảng kế nhiệm Vera Rubin Ultra, dự kiến ra mắt vào năm 2027.
Theo dõi từ 1M AI News, NVIDIA đã phát hành DLSS 5 tại hội nghị GTC, bằng cách kết hợp dữ liệu cấu trúc hình ảnh 3D truyền thống với mô hình AI tạo ra, cho phép GPU GeForce thực hiện kỹ thuật render 4K cấp hình ảnh thời gian thực, không cần phải tạo raster từng pixel cho mỗi yếu tố trong cảnh. Huang Renxun trong bài phát biểu của mình mô tả phương pháp này như "hợp nhất đồ họa 3D có khả năng kiểm soát và AI tạo ra có tính xác suất cao," gọi phần trước "tuyệt đối có thể dự đoán," và phần sau "rất chân thực," việc kết hợp cả hai giúp đội ngũ phát triển tạo ra nội dung "vừa tinh vi và có thể kiểm soát."
Hoàng Nhân Hiện định vị con đường công nghệ của DLSS 5 là điểm xuất phát của việc chuyển đổi mô hình rộng lớn hơn, gọi là "phương pháp kết hợp thông tin có cấu trúc với trí tuệ nhân tạo theo hướng sinh học, sẽ được tái tạo trong từng ngành công nghiệp". Anh ta lấy các nền tảng dữ liệu doanh nghiệp như Snowflake, Databricks, BigQuery làm ví dụ, dự đoán rằng trong tương lai, AI Agent sẽ đồng thời gọi dữ liệu có cấu trúc và tạo dựng để xử lý nhiệm vụ cơ sở dữ liệu.
Theo theo dõi từ 1M AI News, Người sáng lập và Giám đốc điều hành NVIDIA, Hoàng Nhân Hiện, đã chính thức công bố tại Hội nghị GTC 2026 rằng nền tảng Vera Rubin đã bắt đầu sản xuất hàng loạt, tích hợp bảy chip mới hoàn toàn, bao gồm năm loại hệ thống rack, với thiết kế tổng thể dành cho một máy tính siêu vi xử lý AI.
Hệ thống chính Vera Rubin NVL72 tích hợp 72 GPU Rubin và 36 CPU Vera, thông qua NVLink 6 kết nối. So với thế hệ trước của nền tảng Blackwell, số lượng GPU cần cho việc huấn luyện mô hình chuyên gia kết hợp lớn đã giảm xuống còn một phần tư, hiệu suất lưu thông tính từng wát cao nhất có thể đạt được gấp 10 lần so với Blackwell, chi phí mỗi token giảm đến một phần mười.
Năm loại hệ thống rack tạo nên cơ sở hạ tầng nhà máy AI hoàn chỉnh:
- Hệ thống Rack GPU Vera Rubin NVL72
- Hệ thống Rack CPU Vera (256 CPU Vera, hiệu suất gấp đôi so với CPU truyền thống, tăng tốc độ 50%)
- Hệ thống Rack Tăng Tốc Học Sâu Groq 3 LPX
- Hệ thống Rack Lưu Trữ BlueField-4 STX (thiết kế đặc biệt cho bộ nhớ đệm khóa của AI Agent, hiệu suất lưu thông tối đa gia tăng 5 lần)
- Hệ thống Rack Mạng Ethernet Spectrum-6 SPX
Trong phần quản lý năng lượng, NVIDIA cùng công bố nền tảng DSX: DSX Max-Q có thể triển khai nhiều hệ thống cơ sở hạ tầng AI lên đến 30% trong một giới hạn năng lượng điện cố định, DSX Flex có thể kích hoạt công suất điện lực dự trữ 100 gigawatt trước đây không sử dụng được.
Các nhà cung cấp dịch vụ đám mây như AWS, Google Cloud, Microsoft Azure, Oracle Cloud cùng CoreWeave, Lambda, Nebius và các nhà sản xuất hệ thống như Cisco, Dell Technologies, HP Enterprise, Lenovo, AMD đã tuyên bố rằng họ sẽ tung ra sản phẩm Vera Rubin trong nửa cuối năm nay. Anthropic, Meta, Mistral AI và OpenAI đã xác định sẽ sử dụng nền tảng này để huấn luyện mô hình quy mô lớn hơn.
Hoàng Nhân Hiân cho biết, dự đoán của anh là tổng đơn đặt hàng của hệ thống Blackwell và Vera Rubin sẽ ít nhất đạt 1 nghìn tỷ đô la trong giai đoạn từ năm 2025 đến 2027, gấp đôi so với dự đoán 500 tỷ đô la của GTC năm ngoái.
Gần đây, công cụ trí tuệ nhân tạo mã nguồn mở được gọi là "Cái Càng" (OpenClaw) đang trở nên rất hot, NVIDIA (NVDA.O) cũng đã công bố việc phát hành chế độ siêu đơn giản, giúp người dùng "nuôi tôm". CEO của NVIDIA, Hoàng Nhân Hiân, đã thông báo việc phát hành NemoClaw dành cho nền tảng hệ thống OpenClaw trong sự kiện GTC vào thứ Hai, cho biết người dùng chỉ cần một lệnh duy nhất là có thể cài đặt bộ công cụ triển khai được tinh chỉnh sâu cho OpenClaw. NemoClaw sử dụng phần mềm NVIDIA Agent Toolkit, chỉ cần một lệnh là tối ưu hóa tốt nhất cho OpenClaw. Nó cài đặt OpenShell, cung cấp mô hình mở và một hộp cát cách ly, cung cấp bảo mật và riêng tư dữ liệu cho các đại lý thông minh tự trị.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia