BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Biến AI thành hệ thống thực thi cá nhân, Sổ tay thực hành quản lý đặc biệt của Claude cho các Tác nhân Được Quản lý mới nhất

Đọc bài viết này mất 20 phút

Từ Cuộc Gọi đến Được Giao, Biến AI từ Công Cụ thành Hệ Thống Thực Thi Có Thể Chạy Lâu Dài

Tiêu đề gốc: Ra mắt Claude Managed Agents
Tác giả gốc: Lance Martin
Dịch: Peggy, BlockBeats

Chú thích biên tập viên: Bài viết này giới thiệu về Claude Managed Agents đã ra mắt. Nó cung cấp một dạng phần mềm tiến gần hơn tới tương lai: Các đại lý thông minh không còn chỉ là giao diện phản hồi một lần cho yêu cầu, mà là một hệ thống thực thi có thể được cấu hình, triển khai, lên lịch và hoạt động lâu dài.

Bằng cách mà Claude Managed Agents đã phân rã triệt để giữa "läch" (mô hình và khung thực thi), "thực thi" (công cụ và hộc cát) và "quy trình" (phiên và nhật ký), agent đã chuyển từ "logic trong mã" sang một đơn vị cơ sở hạ tầng độc lập. Thiết kế này không chỉ nâng cao tính ổn định và bảo mật của hệ thống trong các nhiệm vụ dài hạn, mà còn cho phép agent mở rộng liên tục theo khả năng của mô hình mà không bị ràng buộc bởi các khung thức hiện có.

Trong khuôn khổ này, các mô hình sử dụng phổ biến cũng đã thay đổi: Từ kích hoạt sự kiện, chạy định kỳ, đến việc thực thi tự động "kích hoạt là triển khai" và thậm chí là các nhiệm vụ phức tạp kéo dài qua nhiều ngày hoặc thậm chí hàng tuần, agent bắt đầu thật sự có khả năng "làm việc liên tục". Điều này có nghĩa là, giá trị của Trí tuệ Nhân tạo không chỉ phản ánh trong chất lượng phản hồi một lần, mà còn ở khả năng chồng lấp và lợi tức theo chiều thời gian.

Nếu trước đây API cho phép các nhà phát triển "gọi trí tuệ", thì Managed Agents đang cố gắng trả lời một câu hỏi khác: Làm thế nào để biến trí tuệ trở thành một hệ thống có thể được quản lý, lên lịch và hoạt động liên tục. Theo ý nghĩa này, agent không chỉ còn là một công cụ, mà gần giống một ngôn ngữ tính toán mới.

Dưới đây là nội dung gốc:

TL;DR

Claude Managed Agents là bộ khung thực thi agent đã xây sẵn, có thể cấu hình (agent harness), chạy trên cơ sở hạ tầng được quản lý. Bạn chỉ cần định nghĩa một agent như một mẫu - bao gồm các công cụ, kỹ năng, kho lưu trữ tệp/mã nguồn và những phần còn lại của khung thực thi và cơ sở hạ tầng được hệ thống cung cấp. Hệ thống nhằm mục tiêu đuổi kịp mức độ thông minh tăng nhanh của Claude và hỗ trợ các nhiệm vụ dài hạn.

Các liên kết liên quan như sau:

·Blog của Claude: Mô hình sử dụng và trường hợp của khách hàng

·Engineering Blog: Thiết kế của Claude Managed Agents

·Tài liệu: Hướng dẫn bắt đầu nhanh, Tổng quan về CLI và SDK

Claude Managed Agents

Tại sao cần Claude Managed Agents

API tin nhắn của Claude cơ bản là cổng vào tương tác trực tiếp với mô hình: gửi tin nhắn, nhận khối nội dung. Các tác nhân thông minh xây dựng dựa trên API tin nhắn cần phụ thuộc vào một "khung chạy" (harness) để thực hiện định tuyến cuộc gọi công cụ, quản lý ngữ cảnh và các công việc khác. Nhưng điều này mang lại một số vấn đề:

1. Khung chạy cần phải liên tục tiến triển với khả năng của Claude
Gần đây, tôi đã viết một bài blog, giới thiệu cách xây dựng một tác nhân dựa trên khả năng cơ bản của API Claude, dùng để xử lý sắp xếp công cụ và quản lý ngữ cảnh. Nhưng vấn đề là, khung chạy của tác nhân thường ẩn chứa một số giả thuyết về "Những điều mà Claude không thể làm". Khi khả năng của Claude tăng cường, những giả thuyết này sẽ nhanh chóng lỗi thời, thậm chí trở thành rào cản hiệu suất ngược lại. Do đó, khung chạy phải được cập nhật liên tục để đuổi kịp tốc độ tiến hóa của Claude.

2. Chu kỳ công việc của Claude đang dần trở nên dài hơn
Thời gian mà Claude có thể xử lý công việc đang tăng theo cấp số nhân, trong các bài kiểm tra METR, đã vượt quá 10 giờ công việc của con người. Điều này đặt ra yêu cầu cao hơn đối với cơ sở hạ tầng cơ bản của tác nhân: cần có tính bảo mật, ổn định trong quá trình chạy dài hạn (đối mặt với mọi sự cố cơ sở hạ tầng), và khả năng mở rộng (ví dụ hỗ trợ nhiều nhóm tác nhân thông minh chạy cùng lúc).

Tại sao những vấn đề này quan trọng

Giải quyết các thách thức nói trên cực kỳ quan trọng, vì chúng tôi dự đoán rằng, trong tương lai, Claude sẽ có khả năng liên tục chạy và xử lý các vấn đề phức tạp nhất của con người trong vài ngày, vài tuần hoặc thậm chí vài tháng.

Claude Agent SDK là bước đầu tiên trong hướng này, cung cấp một khung chạy hệ thống trí tuệ nhân tạo phổ quát và dễ sử dụng. Trong khi đó, Claude Managed Agents là bước tiến xa hơn: dựa trên cơ sở này, cung cấp một khung chạy đầy đủ + cơ sở hạ tầng quản lý, được thiết kế đặc biệt để hỗ trợ việc thực thi nhiệm vụ an toàn, đáng tin cậy trong thời gian dài.

Cách Bắt Đầu Sử Dụng

Một cách đơn giản để bắt đầu là sử dụng kỹ năng claude-api mã nguồn mở của chúng tôi, nó có thể được sử dụng ngay trong Claude Code. Bạn chỉ cần cài đặt phiên bản mới nhất của Claude Code, sau đó chạy lệnh con dưới đây để hoàn tất cấu hình khởi tạo của Claude Managed Agents.

Tôi cá nhân rất hâm mộ cách tiếp cận mới này thông qua "kỹ năng" và đã sử dụng rộng rãi kỹ năng này trong thực tế.

Ngoài ra, bạn cũng có thể tham khảo tài liệu của chúng tôi, nhanh chóng làm quen với SDK hoặc CLI, và phát triển nguyên mẫu cho trí tuệ nhân tạo trong Claude Console.

Trường Hợp Sử Dụng

Bạn có thể thấy nhiều trường hợp thú vị trên blog chính thức của Claude. Kết hợp những trường hợp này và kinh nghiệm cá nhân của tôi, tôi nhận thấy một số mẫu sử dụng phổ biến:

1. Kích hoạt sự kiện (Event-triggered)
Agent được quản lý kích hoạt bởi một dịch vụ nào đó để thực thi nhiệm vụ.
Ví dụ, khi hệ thống phát hiện lỗi, một Agent quản lý sẽ tự động được gọi để viết đoạn vá và gửi PR. Không cần can thiệp của con người từ "Phát hiện vấn đề" đến "Thực thi sửa lỗi".

2. Thực thi định kỳ (Scheduled)
Thiết lập nhiệm vụ định kỳ cho Agent quản lý.
Chẳng hạn, tôi và nhiều người khác thường sử dụng cách tiếp cận này để tạo bản tóm tắt hàng ngày (ví dụ: Tổng hợp hoạt động trên Nền tảng X hoặc GitHub, hoặc tiến độ làm việc của một nhóm Agent). Đây là một ví dụ về bản tóm tắt hàng ngày cho sự kiện X mà tôi sử dụng hàng ngày.

3. Kích hoạt một lần, không cần theo dõi (Fire-and-forget)
Agent quản lý được kích hoạt bởi con người để thực thi nhiệm vụ, nhưng không cần can thiệp liên tục trong quá trình. Ví dụ, thông qua Slack hoặc Teams, giao nhiệm vụ cho Agent quản lý, nó sẽ tự động hoàn thành và trả kết quả (như bảng, slide, hoặc thậm chí ứng dụng).

4、Công việc theo chu kỳ dài (Long-horizon tasks)
Công việc chạy trong thời gian dài, là một trong những tình huống mà tôi cho là Managed Agents đặc biệt có giá trị.
Tôi đã thực hiện một số thử nghiệm dựa trên kho lưu trữ tự động nghiên cứu của Andrej Karpathy, để khám phá cách áp dụng khác nhau. Ví dụ, gần đây tôi đã sử dụng thư viện pretext của _chenglou làm đầu vào, để cho một Managed Agent nghiên cứu cách áp dụng nó vào nội dung blog kỹ thuật của chúng tôi.

Khái niệm cốt lõi

Trong quá trình bắt đầu, có ba khái niệm cốt lõi cần hiểu:

1、Tác nhân (Agent)
Một cấu hình quản lý phiên bản, xác định "bản tính" của tác nhân: bao gồm mô hình, system prompt, công cụ, kỹ năng, máy chủ MCP, v.v. Sau khi tạo một lần, có thể gọi lại nhiều lần thông qua ID.

2、Môi trường (Environment)
Một mẫu thiết kế, dùng để mô tả môi trường hộp cát cung cấp cho công cụ của tác nhân chạy (ví dụ: loại thời gian chạy, chiến lược mạng, cấu hình gói phụ thuộc, v.v.).

3、Phiên (Session)
Một phiên bản chạy có trạng thái, được khởi động dựa trên cấu hình tác nhân và môi trường đã tạo trước đó. Nó sẽ tạo một hộp cát hoàn toàn mới từ mẫu môi trường, gắn kết tài nguyên cần thiết cho quá trình chạy này (ví dụ: tệp tin, kho lưu trữ GitHub), và an toàn lưu trữ thông tin xác thực trong kho chứa khóa (như thông tin xác thực MCP).

Có thể hiểu như sau:

·Tác nhân = Cấu hình chính

·Môi trường = Mẫu hộp cát cần thiết cho tác nhân chạy

·Phiên = Quá trình thực thi cụ thể một lần

Một Tác nhân có thể tương ứng với nhiều Phiên.

Cách sử dụng

Có thể tham khảo tài liệu cụ thể. Sử dụng chia thành hai loại chính:

1、SDK (Hướng vào mã)
Đưa SDK vào ứng dụng, điều khiển phiên chạy trong thời gian chạy. Hiện tại, Managed Agents đã hỗ trợ 6 ngôn ngữ: Python, TypeScript, Java, Go, Ruby, PHP.

2. CLI (Command Line Interface)
Thực hiện tất cả các tài nguyên API thông qua dòng lệnh, bao gồm các agents, environments, sessions, vaults, skills, files, vv. Mỗi loại tài nguyên đều có các lệnh con tương ứng.

Mô hình Thực hành Phổ biến:
Thường sử dụng CLI để hoàn thành cấu hình và khởi tạo, sử dụng SDK để xử lý logic thời gian chạy.
Mẫu Agent là bền vững—you có thể tạo một mẫu (ví dụ, xác định mô hình bằng YAML, hỏi hệ thống, công cụ, máy chủ MCP, kỹ năng), lưu trữ trên Git, và áp dụng trong quy trình triển khai thông qua CLI.

Cơ chế hoạt động

Tôi đã viết một bài blog kỹ thuật cùng với @mc_anthropic, @gcemaj, @jkeatn, giải thích chi tiết về quá trình xây dựng của Claude Managed Agents. Một kết luận quan trọng trong bài viết là: cho phép agent có thể mở rộng theo cấp độ thông minh của Claude, về bản chất là một "vấn đề cơ sở hạ tầng", chứ không chỉ là một vấn đề thiết kế khuôn khổ chạy.

Điều đó có nghĩa, thách thức thực sự không phải là "làm thế nào để viết một agent thông minh hơn", mà là làm thế nào để xây dựng một hệ thống có thể hoạt động ổn định, mở rộng được, phát triển mà agent có thể chịu đựng nhiệm vụ ngày càng phức tạp và lâu dài hơn.

基于这一思路，我们并没有去设计一种固定的 agent 运行框架（harness），因为我们预期它会持续演进。相反，我们将系统中的几个关键部分进行了「解耦」：

「Đầu não」 (Claude và khuôn khổ chạy của nó)

「Đôi tay」 (Containerization và các công cụ thực thi cụ thể)

「Phiên」 (Nhật ký sự kiện ghi lại quá trình thực thi)

Ba yếu tố này được thiết kế như các giao diện độc lập lẻ, giả định về nhau càng ít càng tốt. Mỗi phần có thể thất bại, thay thế độc lập mà không ảnh hưởng đến hệ thống tổng thể.

Trong bài viết, chúng tôi cũng chia sẻ cách mà kiến trúc này mang lại độ tin cậy, an ninh và sự linh hoạt cao hơn—đồng thời dành chỗ cho cơ sở hạ tầng cho việc kế nhiệm khuôn khổ chạy mới, môi trường thực thi hoặc phiên thực thi.

Kết Luận

Tôi rất hào hứng với những dự án đang khám phá việc điều phối đa tác nhân (multi-agent orchestration) hoặc nhiệm vụ dài hạn. Một điểm mà tôi luôn băn khoăn trong quá khứ là: framework chạy của agent thường khó thể để đuổi kịp sự tiến hóa của khả năng mô hình.

Ý nghĩa của Claude Managed Agents nằm ở việc, nó xử lý vấn đề của framework chạy và lớp cơ sở hạ tầng cho bạn, giúp bạn có thể tập trung vào tầng cao hơn—thấy "agent" chính là một loại nguyên tử cơ bản mới trong API của Claude, để có thể tiến hành khám phá và xây dựng nhiều hơn trên nó.

[Liên kết bản gốc]

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

#Claude #trí tuệ nhân tạo

Báo lỗi/Báo cáo