BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Claude Code đã tổng hợp toàn bộ 500,000 dòng mã bị rò rỉ, Lõi thực sự của AI Agent là gì?

律动BlockBeats

Đọc bài viết này mất 22 phút

Mã code trực tiếp gọi giao diện của mô hình AI chỉ chiếm 1,6% tổng lượng.

51.2 万行代码，1906 个文件，59.8 MB của source map. Vào sáng sớm ngày 31 tháng 3, Chaofan Shou của Solayer Labs phát hiện rằng sản phẩm cờ của Anthropic, Claude Code, đã tiết lộ toàn bộ mã nguồn trên kho lưu trữ npm công cộng. Trong vài giờ, mã đã được sao chép lên GitHub, số lượng fork đã vượt qua con số 4.1 vạn.

Điều này không phải là lần đầu tiên Anthropic mắc lỗi này. Khi Claude Code được phát hành lần đầu vào tháng 2 năm 2025, một vụ rò rỉ tương tự của source map đã xảy ra. Phiên bản lần này có số hiệu là v2.1.88, nguyên nhân rò rỉ cũng giống như vậy, công cụ xây dựng Bun mặc định tạo source map, trong khi file .npmignore đã bỏ lỡ file này.

Hầu hết báo cáo tập trung vào các điều bất ngờ trong vụ rò rỉ, như hệ thống thú ảo, chế độ "tay con" cho phép Claude ẩn danh gửi mã cho dự án mã nguồn mở. Nhưng vấn đề đáng giáng chút đó là tại sao một mô hình Claude giống nhau, nhưng hiệu suất giữa phiên bản trên web và phiên bản trong Claude Code lại khác biệt như vậy? 51.2 万行代码 thực sự đang thực hiện công việc gì?

Mô hình chỉ là phần nổi của tảng băng

Câu trả lời nằm trong cấu trúc mã nguồn. Theo phân tích ngược mã nguồn rò rỉ từ cộng đồng GitHub, trong 51.2 万行 TypeScript, mã giao diện trực tiếp gọi mô hình AI chỉ chiếm khoảng 8.000 dòng, chiếm 1.6% tổng thể.

Phần còn lại 98.4% đang làm gì? Hai mô-đun lớn nhất là công cụ tìm kiếm (46.000 dòng) và hệ thống công cụ (29.000 dòng). Công cụ tìm kiếm xử lý cuộc gọi API LLM, đầu ra dòng thông tin, sắp xếp bộ nhớ cache và quản lý cuộc trò chuyện đa vòng. Hệ thống công cụ xác định khoảng 40 công cụ tích hợp sẵn và 50 lệnh gạch ngang, hình thành một kiến trúc giống như plugin, mỗi công cụ có kiểm soát quyền riêng.

Ngoài ra, có 25.000 dòng mã cung cấp giao diện người dùng cuối (trong đó một file tên là print.ts dài 5594 dòng, một hàm đơn vượt qua 3167 dòng), 20.000 dòng về an ninh và kiểm soát quyền (bao gồm 23 lệnh kiểm tra bảo mật Bash theo số hiệu và 18 lệnh Zsh được chặn), cùng với 18.000 dòng về hệ thống sắp xếp đa proxy.

Nhà nghiên cứu máy học Sebastian Raschka sau khi phân tích mã rò rỉ đã chỉ ra rằng, lý do mà Claude Code mạnh mẽ hơn phiên bản trên web của cùng một mô hình không nằm ở trực giác, mà nằm vào cấu trúc phần mềm xung quanh mô hình, bao gồm việc tải ngữ cảnh kho lưu trữ, lập lịch sử dụng công cụ chuyên biệt, chiến lược cache và cộng tác nhánh phụ. Ông thậm chí tin rằng, nếu triển khai cùng một kiến trúc công nghệ trong DeepSeek hoặc Kimi hoặc các mô hình khác, cũng có thể đạt được hiệu suất lập trình tương tự.

Một so sánh trực quan có thể giúp hiểu được sự khác biệt này. Khi bạn nhập một câu hỏi trên phiên bản trang web của ChatGPT hoặc Claude, sau khi mô hình xử lý xong, nó sẽ trả lời và không giữ lại bất kỳ thông tin nào sau khi cuộc trò chuyện kết thúc. Nhưng cách tiếp cận của Claude Code hoàn toàn khác, khi khởi động, nó trước tiên sẽ đọc tệp dự án của bạn, hiểu cấu trúc thư viện mã của bạn, nhớ lại sở thích của bạn như lần trước bạn nói "đừng mock cơ sở dữ liệu trong bài kiểm tra". Nó có thể trực tiếp thực thi lệnh trong terminal của bạn, chỉnh sửa tệp, chạy bài kiểm tra, và khi gặp nhiệm vụ phức tạp, nó sẽ phân chia thành nhiều tác vụ con và giao cho các tác nhân con xử lý song song. Nói cách khác, trí tuệ nhân tạo trên trang web là một cửa sổ hỏi đáp, còn Claude Code là một đồng nghiệp sống trong máy tính của bạn.

Có người đã so sánh cấu trúc này với hệ điều hành: 42 công cụ tích hợp tương đương với các cuộc gọi hệ thống, hệ thống quyền tương đương với quản lý người dùng, giao thức MCP tương đương với trình điều khiển thiết bị, sắp xếp tác nhân con tương đương với lịch trình quy trình. Mỗi công cụ ra khỏi nhà máy mặc định được đánh dấu là "không an toàn, có thể ghi", trừ khi nhà phát triển tuyên bố rằng nó an toàn. Công cụ chỉnh sửa tệp sẽ kiểm tra bạn có đọc tệp đó trước đó hay không, nếu chưa đọc, nó sẽ không cho phép bạn thay đổi. Điều này không phải là một bot trò chuyện đã được cải thiện với một số công cụ, mà là một môi trường chạy với LLM làm hạt nhân, với cơ chế bảo mật đầy đủ.

Điều này có nghĩa là một điều: Rào cản cạnh tranh của sản phẩm trí tuệ nhân tạo có thể không nằm ở tầng mô hình, mà nằm ở tầng kỹ thuật.

Mỗi khi đẩy cache, chi phí tăng gấp 10 lần

Trong mã rò rỉ có một tệp mang tên promptCacheBreakDetection.ts, nó theo dõi 14 vector có thể gây ra việc cache đẩy. Tại sao kỹ sư của Anthropic phải dành nhiều công sức để ngăn chặn việc đẩy cache?

Nếu xem giá cả chính thức của Anthropic, bạn sẽ hiểu. Ví dụ, với Claude Opus 4.6, giá nhập chuẩn là 5 đô la Mỹ cho mỗi triệu mã thông báo, nhưng nếu trúng cache, giá đọc chỉ cần 0.5 đô la Mỹ, rẻ hơn 90%. Nghĩa là, mỗi lần đẩy cache, chi phí suy luận sẽ tăng gấp 10 lần.

Điều này giải thích cho các quyết định thiết kế kiến trúc trong mã rò rỉ dường như quá mức: Khi bạn khởi động Claude Code, nó sẽ tải nhánh git hiện tại, bản ghi commit gần đây nhất và tệp CLAUDE.md làm ngữ cảnh, các nội dung tĩnh này được cache toàn cục, sử dụng dấu ranh giới để phân biệt nội dung động, đảm bảo mỗi cuộc trò chuyện không lặp lại xử lý ngữ cảnh hiện có. Trong mã còn có một cơ chế gọi là sticky latches, ngăn chặn việc chuyển đổi mẫu phá vỡ cache đã thiết lập. Cách tiếp cận cho tác nhân con được thiết kế để tái sử dụng cache của tiến trình cha, thay vì thiết lập lại cửa sổ ngữ cảnh riêng của họ.

Đây là một chi tiết đáng giá để mở rộng. Bất kỳ ai đã sử dụng công cụ lập trình AI đều biết, cuộc trò chuyện càng dài, AI phản hồi càng chậm, vì mỗi vòng trò chuyện phải gửi lại lịch sử trước đó cho mô hình. Phương pháp thông thường là xóa tin nhắn cũ để giải phóng không gian, nhưng vấn đề là, việc xóa bất kỳ tin nhắn nào cũng sẽ làm hỏng tính liên tục của bộ nhớ cache, dẫn đến việc cần xử lý lại toàn bộ lịch sử trò chuyện, làm tăng độ trễ và chi phí đồng thời.

Mã rò rỉ chứa một cơ chế gọi là cache_edits, phương pháp này không xóa thực sự các tin nhắn, mà đánh dấu các tin nhắn cũ là "bỏ qua" tại tầng API. Mô hình không thể nhìn thấy những tin nhắn này nữa, nhưng tính liên tục của bộ nhớ cache vẫn được duy trì. Điều này có nghĩa là sau khi làm sạch vài trăm tin nhắn cũ trong một cuộc trò chuyện dài kéo dài vài giờ, tốc độ phản hồi ở vòng tiếp theo sẽ gần như nhanh chóng như vòng đầu tiên. Đối với người dùng thông thường, đây chính là câu trả lời cơ bản cho "tại sao Claude Code có thể hỗ trợ cuộc trò chuyện vô hạn mà không chậm lại".

Theo dữ liệu giám sát nội bộ rò rỉ (từ chú thích mã autoCompact.ts, đánh dấu ngày 10 tháng 3 năm 2026), trước khi áp dụng giới hạn thất bại tự động nén, Claude Code đã lãng phí khoảng 25.000 lượt gọi API mỗi ngày. Có 1279 phiên người dùng mà có hơn 50 lần liên tiếp thất bại trong quá trình nén, phiên nghiêm trọng nhất liên tiếp thất bại đến 3272 lần. Cách khắc phục chỉ là thêm một dòng giới hạn: MAX_CONSECUTIVE_AUTOCOMPACT_FAILURES = 3.

Vì vậy, đối với sản phẩm AI, chi phí suy luận của mô hình có lẽ không phải là tầng đắt nhất, mà quản lý bộ nhớ cache thất bại mới chính là vấn đề.

44 Công Tắc, Hướng Về Cùng Một Hướng

Trên mã rò rỉ ẩn chứa 44 cờ tính năng - các công tắc tính năng đã được biên dịch sẵn, chỉ là chưa được phát hành ra bên ngoài. Theo phân tích của cộng đồng, các cờ này được chia thành năm loại theo miền chức năng, trong đó phần dày nhất là loại "Đại diện Tự trị" (12 cái), hướng về một hệ thống có tên là KAIROS.

KAIROS được được trích dẫn hơn 150 lần trong mã nguồn, nó là một chế độ dịch vụ bảo vệ nền. Claude Code không chỉ là một công cụ phản hồi khi bạn gọi nó, mà là một đại diện luôn chạy ngầm, liên tục quan sát, ghi chép, và hành động một cách tự động vào thời điểm thích hợp. Điều kiện tiên quyết là không làm gián đoạn người dùng, bất kỳ hành động nào có thể làm chặn người dùng hơn 15 giây sẽ bị hoãn.

KAIROS cũng tích hợp chức năng nhận diện tập trung vào cửa sổ terminal. Trong mã nguồn có một trường terminalFocus, liên tục kiểm tra xem người dùng có đang nhìn vào cửa sổ terminal không. Khi bạn chuyển sang trình duyệt hoặc ứng dụng khác, trợ lý sẽ xác định rằng bạn "không có mặt", và chuyển sang chế độ tự động, thực hiện nhiệm vụ một cách chủ động, gửi mã nguồn trực tiếp mà không cần xác nhận từ bạn. Khi bạn quay trở lại terminal, trợ lý ngay lập tức chuyển sang chế độ cộng tác: báo cáo những gì vừa làm và sau đó hỏi ý kiến của bạn. Mức độ tự chủ không cố định, mà phản ánh sự chuyển động thời gian thực của sự chú ý của bạn. Điều này giải quyết một vấn đề khó xử mà các công cụ AI đã gặp phải trong thời gian dài: AI hoàn toàn tự chủ khiến người ta không tin tưởng, AI hoàn toàn bị động thì hiệu quả quá thấp. Lựa chọn của KAIROS là để tính chủ động của AI thay đổi linh hoạt theo sự chú ý của người dùng, nó sẽ đứng im khi bạn nhìn chăm chú vào nó và tự làm việc khi bạn đi ra chỗ khác.

Một hệ thống con khác của KAIROS được gọi là autoDream, mỗi khi tích lũy 5 phiên hoặc sau mỗi khoảng 24 giờ, trợ lý sẽ bắt đầu một quy trình "suy tư" ẩn sau màn hình, bao gồm bốn bước. Đầu tiên, quét qua bộ nhớ hiện tại để hiểu bản thân đang nắm giữ những gì. Tiếp theo, trích xuất kiến thức mới từ nhật ký trò chuyện. Sau đó, kết hợp kiến thức mới và cũ, điều chỉnh mâu thuẫn, loại bỏ sự trùng lặp. Cuối cùng, tinh giản chỉ mục, xóa các mục đã cũ. Thiết kế này lấy cảm hứng từ lý thuyết tập trung bộ nhớ trong khoa học nhận thức. Con người khi ngủ sẽ sắp xếp lại bộ nhớ của mình từ ban ngày, KAIROS khi bạn rời khỏi sẽ sắp xếp lại bối cảnh dự án. Đối với người dùng thông thường, điều này có nghĩa là bạn sử dụng Claude Code càng lâu, nó sẽ hiểu về dự án của bạn càng chính xác, không chỉ là "nhớ những gì bạn đã nói".

Loại thứ hai là "Truyền thụ và An toàn" (8 cờ hiệu). Trong đó, điều đáng chú ý nhất là cơ chế fake_tools, khi đồng thời đáp ứng 4 điều kiện (cờ biên dịch được bật, nhập khẩu CLI được kích hoạt, sử dụng API bên nhất, công tắc từ xa GrowthBook là true), Claude Code sẽ chèn định nghĩa công cụ giả vào yêu cầu API, mục đích là để làm ô nhiễm dữ liệu có thể được ghi lại từ lưu lượng API, được sử dụng trong tập dữ liệu để huấn luyện mô hình cạnh tranh. Đây là một dạng phòng thủ hoàn toàn mới trong cuộc đua vũ trang AI, không phải để ngăn chặn việc sao chép của bạn, mà để bạn sao chép nhận được thông tin sai lầm.

Ngoài ra, trong mã nguồn còn có mô hình Capybara mang tên mã (chia thành ba cấp độ: phiên bản tiêu chuẩn, phiên bản nhanh và phiên bản cửa sổ triệu ngữ cảnh), mà cộng đồng đã rộng rãi đoán là tên mã nội bộ của dòng sản phẩm Claude 5.

Trứng phục sinh: Trong 51.2 nghìn dòng mã, có một hệ thống thú cưng điện tử bí mật

Giữa tất cả kiến trúc kỹ thuật nghiêm túc và cơ chế an toàn, các kỹ sư của Anthropic đã âm thầm phát triển một hệ thống thú cưng ảo hoàn chỉnh, được biết đến nội bộ với tên mã BUDDY.

Theo mã nguồn rò rỉ và phân tích cộng đồng, BUDDY là một thú cưng kỹ thuật số được biểu diễn, sẽ xuất hiện dưới dạng hộp thoại ASCII bên cạnh ô nhập dữ liệu của người dùng. Nó bao gồm 18 loài (bao gồm sên biển, kỳ nhông, nấm, ma, rồng, cũng như một loạt các sinh vật gốc như Pebblecrab, Dustbunny, Mossfrog), được phân loại theo năm cấp độ hiếm: Thông thường (60%), Hiếm (25%), Quý (10%), Huyền bí (4%), và Huyền thoại (1%). Mỗi loài còn có một "biến thể lấp lánh", với Shiny Legendary Nebulynx cực kỳ hiếm chỉ có xác suất xuất hiện một trên một triệu.

Mỗi con BUDDY có năm thuộc tính: DEBUGGING (Gỡ lỗi), PATIENCE (Kiên nhẫn), CHAOS (Hỗn loạn), WISDOM (Trí tuệ), và SNARK (Lời mỉa mai). Chúng cũng có thể đội nón, với các lựa chọn bao gồm vương miện, mũ lễ, mũ cánh quạt, vòng nguyệt quế, mũ phù thủy, và thậm chí một chú vịt nhỏ. Giá trị băm của ID người dùng quyết định bạn sẽ ấp trứng loài thú nào, Claude sẽ tạo tên và tính cách cho nó.

Theo kế hoạch ra mắt rò rỉ, BUDDY dự kiến bắt đầu bản thử nghiệm nội bộ từ ngày 1 đến 7 tháng 4, và chính thức ra mắt vào tháng 5, bắt đầu với nhân viên bên trong Anthropic.

51,2 nghìn dòng mã, 98,4% tập trung vào kỹ thuật hóa, nhưng cuối cùng có người dành thời gian tạo ra một con kỳ nhông điện tử đội mũ cánh quạt. Có lẽ đây mới chính là dòng mã nhân văn nhất trong vụ rò rỉ.

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

#Claude

Báo lỗi/Báo cáo