Theo theo dõi của BeatPulse, công ty mô hình thế giới hàng đầu Odyssey vừa phát hành Odyssey-2 Max, với dữ liệu tham số gấp 3 lần so với thế hệ trước Odyssey-2 Pro và khả năng tính toán đào tạo gấp 10 lần, đây là mô hình thế giới thông dụng lớn nhất của công ty đến nay. Khác với các mô hình video song hướng như Sora, Veo, Odyssey-2 Max sử dụng kiến trúc nhân quả tự hồi quy, dự đoán trạng thái tiếp theo từng khung hình và chấp nhận đầu vào tương tác thời gian thực, có khả năng tạo ra hình ảnh mô phỏng liên tục hơn 120 giây mà không gặp sự cố.
Đối với độ chính xác mô phỏng vật lý, Odyssey-2 Max đạt điểm số 58,52 trên mục vật lý của VBench 2, cao hơn so với 49,67 của Odyssey-2 Pro và 44,92 của NVIDIA Cosmos-Predict2.5-14B; Đạt điểm số 93,02 trên mục vật lý của PAI-Bench. Mô hình dựa trên kiến trúc Transformer tự hồi quy lan truyền (AR DiT), sử dụng phương pháp khớp luồng liên tục và đạt được suy luận thời gian thực thông qua việc làm sạch tiếp xúc trong vài bước. Quá trình đào tạo được thực hiện trên hàng trăm GPU NVIDIA B200, chia làm ba giai đoạn: tiền huấn luyện video quy mô lớn, tương tác và điều kiện hóa nhiệm vụ, và huấn luyện ổn định chuỗi thời gian dài.
Odyssey được thành lập bởi Oliver Cameron (CEO) và Jeff Hawke (CTO) có nguồn gốc từ ngành tự động hóa lái xe, trước đó đã huy động vốn tích lũy 27 triệu USD. Odyssey-2 Max hiện đã mở beta riêng tư cho đối tác trong lĩnh vực robot, trò chơi, mô phỏng, quốc phòng và hệ thống tương tác.
