Anthropic giới thiệu kế hoạch Glasswing, với Apple, Microsoft, Google và các công ty khác hàng đầu đang sử dụng mô hình chưa công bố của mình, Claude Mythos, để quét mã nguồn của họ.

Theo giám sát của 1M AI News, Anthropic đã công bố Kế hoạch An ninh Mạng Project Glasswing vào thứ Ba, đồng thời chính thức giới thiệu mô hình mới Claude Mythos Preview đã bị rò rỉ trước đó. Mô hình này không được bán công khai, Anthropic cho rằng khả năng phòng thủ mạng của nó quá mạnh, cần phải để bên phòng thủ sử dụng trước. Apple, Microsoft, Google, AWS, NVIDIA và 11 tổ chức khác đã trở thành đối tác sáng lập, sẽ sử dụng Mythos Preview để quét lỗ hổng bảo mật trên hệ thống của mình, và hơn 40 tổ chức cơ sở hạ tầng phần mềm chính cũng đã nhận được quyền truy cập.

Giám đốc điều hành Anthropic Dario Amodei trong video công bố nói: 「Chúng tôi không huấn luyện nó chuyên sâu về an ninh mạng, chúng tôi huấn luyện nó chuyên sâu về lập trình, nhưng hiểu biết chuyên sâu về lập trình đồng nghĩa với hiểu biết chuyên sâu về an ninh mạng. Các mô hình mạnh mẽ hơn sẽ liên tục xuất hiện từ chúng tôi và các công ty khác, chúng ta cần một phương án ứng phó.」

Trong vài tuần qua, Mythos Preview đã phát hiện hàng nghìn lỗ hổng ngày 0 nguy hiểm trên tất cả các hệ điều hành và trình duyệt phổ biến, hầu hết đều tự động hoàn toàn mà không cần sự hướng dẫn của con người. Ba trường hợp đã được vá lỗi:

1. Một lỗ hổng ẩn trong OpenBSD (một hệ điều hành nổi tiếng về an toàn, rộng rãi sử dụng cho tường lửa) trong 27 năm, kẻ tấn công kết nối vào máy mục tiêu có thể làm máy đó đơ
2. Một lỗ hổng trong FFmpeg (thư viện mã nguồn mở được sử dụng rộng rãi cho mã hóa và giải mã video) trong 16 năm, công cụ kiểm thử tự động đã chạy mã đó 500 triệu lần mà không phát hiện thấy
3. Sự lợi dụng chuỗi của nhiều lỗ hổng trong hạt nhân Linux, có thể nâng quyền từ người dùng thông thường đến kiểm soát hoàn toàn toàn bộ máy

Danh sách đầy đủ đối tác sáng lập: AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA, Palo Alto Networks. Anthropic đã cam kết cung cấp tối đa 1 tỷ USD cho việc sử dụng mô hình, và quyên góp thêm 4 triệu USD cho tổ chức bảo mật mã nguồn mở (2,5 triệu cho Alpha-Omega và OpenSSF dưới Linux Foundation, 1,5 triệu cho Apache Software Foundation).

Trên các bài kiểm tra chuẩn: Mythos Preview đã chêch ấn so với Claude Opus 4.6 thế hệ trước:

1. Phục vụ lại lỗi bảo mật mạng CyberGym: 83,1% so với 66,6%
2. Đã được xác minh bằng SWE-bench: 93,9% so với 80,8%
3. Phiên bản SWE-bench Pro: 77,8% so với 53,4%
4. GPQA Diamond: 94,6% so với 91,3%
5. Bài kiểm tra Lãnh thổ Cuối cùng của Nhân loại (bao gồm công cụ): 64,7% so với 53,1%

Sau khi hết ngân sách 1 tỷ USD, các đối tác sáng lập sẽ trả phí 25 USD cho mỗi triệu đầu vào token, và 125 USD cho mỗi triệu đầu ra token, hỗ trợ Claude API, Amazon Bedrock, Vertex AI và Microsoft Foundry. Anthropic dự định triển khai bảo mật trên phiên bản tiếp theo Claude Opus, để định hướng cho việc mở rộng mô hình cấp Mythos trong tương lai.

Trưởng nhóm đỏ Anthropic Logan Graham nói với Wired: 「Khả năng này sẽ trở nên phổ biến trong thời gian từ 6 đến 24 tháng, nhiều giả định ngay trước đây của hệ thống bảo mật hiện tại của chúng tôi có thể sẽ trở nên vô nghĩa.」 Anthropic cam kết công bố kết quả nghiên cứu trong vòng 90 ngày.

Cùng ngày, Anthropic tiết lộ doanh thu hàng năm đã vượt qua 300 tỷ USD (ước tính cuối năm 2025 khoảng 90 tỷ USD), và công bố đã đạt được thỏa thuận về công suất lên đến vài GW với Google và Broadcom, dự kiến sớm nhất là trong tháng 10 năm nay IPO.