Theo giám sát từ 1M AI News, hôm nay nền tảng đánh giá trí tuệ nhân tạo uy tín toàn cầu LMArena (với sự tham gia của hàng triệu người dùng) đã cập nhật Bảng xếp hạng Đặc biệt Code Arena, với GLM-5.1 chiếm vị trí đầu tiên trên thế giới về mô hình mã nguồn mở và xếp hạng thứ ba về mô hình toàn cầu.
GLM-5.1 không chỉ kế thừa khả năng mã hóa SOTA mở nguồn từ thế hệ trước, mà còn đạt được tiến triển trong Nhiệm vụ Chiều dài xa (Long-Horizon Task), bao gồm:
1. Xây dựng giao diện Linux từ đầu trong vòng 8 giờ;
2. Phá vỡ chướng ngại về tối ưu cơ sở dữ liệu vector sau 655 lần lặp lại;
3. Tối ưu hóa lần gọi công cụ qua 1000 chu kỳ để nâng cao tải trọng mô hình học máy thực sự.
Đáng chú ý, theo tiêu chuẩn đánh giá tương đương trên Bảng xếp hạng METR, GLM-5.1 là mô hình mã nguồn mở duy nhất đạt khả năng làm việc liên tục trong 8 giờ và là một trong số ít mô hình trên toàn cầu có khả năng như vậy ngoại trừ Claude Opus 4.6.
