Theo theo dõi từ Beat AI, NVIDIA đã phát hành trọng số mô hình Cosmos-Reason2-32B. Cosmos Reason 2 là mô hình suy luận AI vật lý mà NVIDIA đã phát hành vào cuối năm ngoái (VLM, một mô hình xử lý hình ảnh, video và văn bản cùng một lúc), được thiết kế đặc biệt để dạy robot và hệ thống lái tự động hiểu về không gian, thời gian, và các quy luật vật lý cơ bản. Lúc đó chỉ có 2 phiên bản nhỏ với 20 tỷ và 80 tỷ tham số được phát hành, bản flagship với 320 tỷ tham số mới chỉ được công bố lần đầu tiên. Nền tảng là Qwen3-VL-32B-Instruct áp dụng Giấy phép Mô hình Mở NVIDIA có thể sử dụng cho mục đích thương mại.
Đưa cho nó một đoạn video lái xe, nó có thể xem và suy luận đánh giá xem việc rẽ phải có an toàn hay không; đưa cho nó một bức ảnh kho hàng, nó có thể đánh dấu tọa độ 2D/3D và hộp biên của từng mặt hàng hàng hóa. Ba ứng dụng chính bao gồm: phân tích luồng video của cảnh thành phố và công nghiệp, gán nhãn dữ liệu cảm biến hàng loạt, và là bộ não lập kế hoạch cho robot hình người và xe lái tự động. So với thế hệ trước, các cải tiến bao gồm phát hiện mục tiêu và liên kết thời gian chính xác, cửa sổ ngữ cảnh mở rộng lên 256K token.
