Theo Động Sát Beating giám sát, công ty lập trình AI Cognition đã phát hành kiến trúc mô hình lai Devin Fusion dành cho lập trình tác nhân thông minh.
Hệ thống này đạt được sự cân bằng giữa hiệu suất của mô hình tiên tiến và chi phí thấp hơn thông qua hai thiết kế cốt lõi: Đầu tiên là cơ chế "Phó Tay (Sidekick)", cho phép các tác nhân mô hình nhỏ tiết kiệm hoạt động song song với các tác nhân mô hình lớn tiên tiến. Mô hình lớn giữ "quyền phán quyết" về lập kế hoạch, làm rõ yêu cầu và đánh giá cuối cùng, trong khi các "công việc chân tay" như khám phá mã, kiểm thử, xác thực định dạng được giao cho mô hình nhỏ. Cả hai bên duy trì bối cảnh bộ nhớ đệm độc lập để tránh chi phí vô hiệu hóa bộ nhớ đệm đắt đỏ; Thứ hai là định tuyến động, điều chỉnh mô hình linh hoạt theo sự phát triển của nhiệm vụ trong phiên làm việc và chọn chuyển đổi khi nén bối cảnh, nhằm đạt được nâng cấp mô hình "chi phí bằng không".
Kết quả kiểm thử cho thấy, trong bài kiểm tra chuẩn FrontierCode đo lường tính chính xác và chất lượng mã, Devin Fusion duy trì hiệu suất của mô hình tiên tiến, đồng thời giảm trung bình 35% chi phí phát triển cho các mô hình cấp GPT-5.5 và Opus 4.8; Nếu kết hợp với Fable 5, chi phí có thể giảm 41% (Lưu ý: Do ảnh hưởng của lệnh từ Chính phủ Hoa Kỳ, quyền truy cập Fable 5 đã bị tạm dừng từ ngày 12 tháng 6 năm 2026, mức giảm này dựa trên dữ liệu kiểm thử lịch sử).
Trong quá trình phát triển nội bộ, 88% PR được hợp nhất cuối cùng của nhóm hoàn toàn do định tuyến tự động của Fusion thúc đẩy. Tuy nhiên, khi nhiệm vụ phụ thuộc quá nhiều vào ý định phát triển tinh vi phức tạp và phán đoán chủ quan (ví dụ như phát triển đa chức năng trên nhiều tệp liên quan đến React/Redux), việc ủy thác quá mức dẫn đến hiệu suất giảm đáng kể, điểm số từ 54 giảm xuống còn 27.
