Theo theo giám sát từ 1M AI News, Tencent đã phát hành dòng mô hình cơ bản Thực Thể Hóa thông qua HY-Embodied-0.5, phiên bản 2B với 2 tỷ tham số đã được công bố mở mã nguồn. Các mô hình trong dòng này được thiết kế cho thực thể thông minh thế giới thực, tập trung vào khả năng nhận biết thời gian không gian và suy luận thực thể, có thể được áp dụng trong dự đoán môi trường, thực thi tương tác và lập kế hoạch nhiệm vụ.
Dòng mô hình này bao gồm hai phiên bản: 2B và 32B. Mô hình 2B dành cho các thiết bị cạnh và triển khai nhẹ, còn phiên bản 32B được sử dụng cho các nhiệm vụ suy luận phức tạp và quyết định trí tuệ cao cấp. Trong cấu trúc kỹ thuật, HY-Embodied-0.5 giới thiệu cơ chế Mixture-of-Transformers (MoT) để thực hiện tính toán đa dạng, và thông qua Token tiềm ẩn để cải thiện khả năng hiểu biết biểu diễn, đồng thời kết hợp với huấn luyện tiến hóa tự nâng cấp và phương pháp chưng cất dựa trên chiến lược, thực hiện tinh chỉnh khả năng giữa các mô hình kích thước khác nhau.
Về hiệu suất, dòng mô hình này đã thể hiện sự xuất sắc trong 22 bài kiểm tra chuẩn, trong đó mô hình 2B vượt trội trên 16 nhiệm vụ so với mô hình tiên tiến cùng quy mô (SOTA), phiên bản 32B đã gần đạt đến mức đỉnh cao, thể hiện khả năng tổng quát thông minh thực thể mạnh mẽ và tiềm năng ứng dụng thực tiễn.
