Ngày 25 tháng 2, một nhóm có tên Nous Research đã âm thầm phát hành phiên bản v0.1.0 trên GitHub. Ban đầu, mô hình Hermes này chỉ có một dòng lệnh cài đặt và một câu hướng dẫn sản phẩm: 「Một đại lý phát triển cùng bạn」.
Lúc đó ít người để ý đến nó, ngay cả khi Nous Research có một danh tiếng nhất định trong cộng đồng mô hình, dòng mô hình Hermes của họ trên HuggingFace đã tích luỹ được 33 triệu lượt tải xuống, nhưng sự chú ý của cả cộng đồng nhà phát triển đều đổ dồn vào OpenClaw 「tôm hùm」 đang được thần thánh. Chỉ sau 33 ngày vượt qua React trở thành dự án được ưa chuộng nhất trong lịch sử, 「tôm hùm」 trở thành dự án tăng sao nhanh nhất trong lịch sử GitHub, đỉnh điểm mỗi giờ 710 sao, nhưng chính vào thời điểm này một nhóm nghiên cứu an ninh liên tục tiết lộ lỗ hổng với tốc độ trung bình 2.2 CVE mỗi ngày trong cùng một cửa sổ thời gian, tính đến 63 ngày đã có 138 lỗ hổng bảo mật. Cả cộng đồng bắt đầu suy nghĩ lại một câu hỏi: Liệu cái này có thể sử dụng trong môi trường sản xuất không?
Trong bối cảnh như vậy, Hermes Agent, cũng là một sản phẩm cạnh tranh, cuối cùng cũng có cơ hội khai thác, cũng đã trải qua giai đoạn tăng trưởng nhanh đầu tiên của mình.
Hermes đã viết một công cụ di chuyển từ OpenClaw chỉ với một cú nhấp chuột vào mã nguồn của mình, những nhà phát triển rời khỏi OpenClaw cần một nơi để đặt chân, và Hermes Agent trở thành một lựa chọn tốt được truyền miệng.

Và từ đầu tháng 3, Hermes Agent đã xoạc vào GitHub Trending, đạt vị trí số 11 cao nhất, số sao vượt qua 2200. AwesomeAgents gọi nó là 「Dự án Agent mã nguồn mở tham vọng nhất từ năm 2026 đến nay」, hiện tại trang github của Hermes có 69.9k Star và 9k Fork.
Hôm nay, BlockBeats sẽ trò chuyện với mọi người về điểm khác biệt của Agent này.
Hermes Agent là một đại lý trí tuệ AI tự tiến hóa được xây dựng bởi Nous Research, cũng là đại lý duy nhất hiện tại tích hợp vòng lặp học.
Nó có thể tự động tạo kỹ năng từ trải nghiệm sử dụng, liên tục cải thiện những kỹ năng đó trong quá trình sử dụng, tự động biến kiến thức thành tài sản có thể tái sử dụng, truy xuất lịch sử trò chuyện trước đó của chính mình và liên tục hiểu rõ hơn về người dùng như bạn qua nhiều phiên trò chuyện.
Vậy nên, đơn giản nói, Ưu điểm lớn nhất của Hermes Agent chính là: Sử dụng càng nhiều, trở nên thông minh và thuận tiện hơn.
Định vị của nó không phải là trợ lý lập trình liên kết trong IDE, cũng không phải là lớp bọc trò chuyện cho một API duy nhất, nhưng là một Agnet thực sự đặt trên máy chủ của bạn, có khả năng nhớ những gì nó học được, và trở nên mạnh mẽ hơn theo thời gian hoạt động.
Nous Research từ đầu đã định vị mình là một phòng thí nghiệm AI ưu tiên mã nguồn mở, phân cấp, với mục tiêu xây dựng một AI mà người dùng có thể kiểm soát tự nhiên, chứ không phải tập trung trí thông minh vào vài công ty đóng cửa. Công việc sớm của họ tập trung vào dòng mô hình Hermes, đồng thời đầu tư lớn vào cơ sở hạ tầng và hệ thống, cũng như khám phá công nghệ DisTrO cho việc huấn luyện mô hình trên GPU tiêu dùng phân tán toàn cầu và môi trường mô phỏng tương tác đa tác nhân như WorldSim, Doomscroll và hành vi xa.
Nhóm Hermes Agent này từng xây dựng các mô hình Nomos, Psyche.
Cơ chế cốt lõi nhất của Hermes Agent là hệ thống ghi nhớ và hệ thống kỹ năng của nó. Agent duy trì hai tệp cơ bản: MEMORY.md chứa thông tin môi trường, quy ước và kinh nghiệm rút ra từ các nhiệm vụ trước đó; USER.md chứa sở thích và phong cách giao tiếp của bạn. Cả hai tệp này sẽ được tự động nhập vào gợi ý hệ thống mỗi khi bắt đầu một phiên trò chuyện, tương đương với "bộ nhớ làm việc dài hạn" của Agent. Ngoài ra, tất cả các phiên trò chuyện lịch sử đều được lưu trong cơ sở dữ liệu tìm kiếm toàn bộ văn bản SQLite, giúp Agent có thể truy xuất nội dung trò chuyện từ vài tuần trước.

Đối với hệ thống kỹ năng, sau mỗi lần hoàn thành một nhiệm vụ phức tạp (thường là hơn 5 lần gọi công cụ), Agent sẽ tự động tạo ra một tài liệu Markdown cấu trúc gọn gàng "kỹ năng", ghi lại các bước hoạt động, nội dung đã biết và phương pháp xác minh, dành cho việc sử dụng lại trong tương lai. Tài liệu kỹ năng tuân thủ mô hình tiết lộ dần: Agent mặc định chỉ xem tên và mô tả kỹ năng (khoảng 3000 mã thông báo), và chỉ tải toàn bộ nội dung của một kỹ năng khi cần, nhằm kiểm soát việc tiêu thụ mã thông báo.
Ở mức công cụ, Hermes Agent tích hợp hơn 40 công cụ, bao gồm tìm kiếm web, tự động hóa trình duyệt, hiểu thị hình ảnh, tạo hình ảnh, chuyển đổi văn bản thành giọng nói, cũng như hỗ trợ thiết lập công việc theo định kỳ thông qua ngôn ngữ tự nhiên, giúp Agent thực hiện tự động báo cáo, sao lưu dữ liệu, giám sát hệ thống vv. trong hoàn cảnh không có người trực.
Trong số các công cụ phổ biến nhất, cũng chính là những công cụ mà cộng đồng người dùng phản hồi nhiều nhất khi sử dụng thực tế, và theo cấu trúc chức năng của Hermes và nhu cầu điển hình của cộng đồng phát triển viên, dưới đây là một số công cụ đứng đầu:
Hindsight hiện đang là công cụ độc lập nổi tiếng nhất trong hệ sinh thái, là plugin lưu trữ dài hạn được Hermes khuyến nghị chính thức. Nó tự động gọi lại ngữ cảnh liên quan trước mỗi lần gọi LLM, hỗ trợ triển khai cục bộ PostgreSQL hoặc điện toán đám mây, và đã được tích hợp như Nhà cung cấp Bộ nhớ nguyên sinh trong Hermes.
Anthropic-Cybersecurity-Skills là bộ kỹ năng có điểm đánh giá cao nhất trong hệ sinh thái, bao gồm 753+ kỹ năng an ninh mạng cấu trúc, đồng thời ánh xạ đầy đủ với khung MITRE ATT&CK, phù hợp cho các tình huống nghiên cứu an ninh và thử nghiệm xâm nhập.
mission-control hiện đang là bảng điều khiển xếp hạng cao nhất trong hệ sinh thái, hỗ trợ quản lý đội Agent, phân phối nhiệm vụ, theo dõi chi phí và làm việc đồng thời với nhiều Agent, được cộng đồng khuyến nghị sử dụng như tiêu chuẩn triển khai sản xuất.
Hermes Agent Self-Evolution là một công nghệ tự tiến hóa tiên tiến, sử dụng DSPy + GEPA để tối ưu hóa kỹ năng, gợi ý và mã.
Hermes Workspace là không gian làm việc nguyên sinh của Hermes, tích hợp giao diện trò chuyện, thiết bị đầu cuối và trình quản lý kỹ năng, là cổng vào đồ họa phổ biến nhất.
Hơn nữa, nó cũng có thể tạo ra Agent con độc lập, trong đó mỗi Agent con có ngữ cảnh trò chuyện riêng, thiết bị đầu cuối và script Python RPC riêng, từ đó thực hiện luồng công việc song song không tốn phí ngữ cảnh.
Về linh hoạt cơ sở hạ tầng, hỗ trợ sáu loại backend thiết bị đầu cuối: chạy cục bộ, Docker, từ xa qua SSH, Daytona không máy chủ, container Singularity và chức năng đám mây Modal. Daytona và Modal sẽ ngủ khi không hoạt động, chi phí gần như bằng không. Bạn có thể chạy nó trên VPS hoặc cụm GPU 5 đô la, và thông qua Telegram để ra lệnh, cho nó làm việc trên máy chủ đám mây mà bạn không bao giờ SSH trực tiếp vào.
Hiện nay, Hermes Agent đang cạnh tranh trực tiếp nhất với OpenClaw, cả hai đều là khung Agent mã nguồn mở hướng tới các nhà phát triển.
Cơ cấu triết học của hai hệ thống này hoàn toàn khác nhau: thiết kế cốt lõi của OpenClaw là một "phương tiện điều khiển", một tiến trình chạy lâu dài thống nhất, chịu trách nhiệm quản lý phiên, định tuyến, thực thi công cụ và trạng thái, mọi thứ đều thông qua bộ điều khiển trung tâm này. Hermes thì lấy vòng lặp thực thi của Agent chính làm trung tâm, xây dựng cổng, lập lịch thời gian, thời gian chạy công cụ và mọi thứ xung quanh chu kỳ lặp đi lặp lại "làm, học, cải tiến" này.
Đặc biệt, sự khác biệt về hệ thống kỹ năng: Hầu hết các kỹ năng của OpenClaw được viết bằng tay, được tải từ các cấp độ khác nhau như workspace, personal, shared hoặc plugin; trong khi Hermes theo đuổi ý tưởng để Agent tự tạo ra kỹ năng từ kinh nghiệm, tạo thành một vòng lặp học tập tự trị thực sự.
Rất dễ bắt đầu. Một dòng lệnh "curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash" là đủ để hoàn thành việc cài đặt, hỗ trợ Linux, macOS và WSL2, Hermes Agent sẽ tự động hoàn tất toàn bộ cấu hình, không cần can thiệp thủ công.

Trang web chính thức của Hermes
Sau khi cài đặt Hermes Agent, chạy "hermes setup" để bắt đầu hướng dẫn thiết lập, chọn nhà cung cấp mô hình của bạn (hỗ trợ Nous Portal, OpenRouter, OpenAI hoặc bất kỳ điểm kết thúc tùy chỉnh nào), kết nối với nền tảng tin nhắn của bạn (Telegram, Discord, Slack hoặc WhatsApp), sau đó bắt đầu cuộc trò chuyện lần đầu tiên. Từ lần tương tác đầu tiên, Hermes Agent ngay lập tức chuyển sang chế độ học tập, bắt đầu xây dựng bộ nhớ, tạo kỹ năng, trở nên mạnh mẽ hơn sau mỗi phiên trò chuyện.
Các lệnh cốt lõi sử dụng hàng ngày bao gồm:
hermes (bắt đầu cuộc trò chuyện),
hermes model (chọn nhà cung cấp LLM và mô hình),
công cụ hermes(cấu hình các công cụ nào được kích hoạt),
cổng hermes(khởi động cổng tin nhắn, kết nối với các nền tảng như Telegram, Discord),
thiết lập hermes(chạy hướng dẫn thiết lập đầy đủ, cấu hình tất cả nội dung một lần),
di cư hermes claw(từ OpenClaw),
cập nhật hermes(cập nhật lên phiên bản mới nhất),
bác sĩ hermes(chẩn đoán vấn đề);
Trường hợp sử dụng phù hợp với Hermes Agent bao gồm: trợ lý AI thông thạo chung cần ghi nhớ ngữ cảnh qua các phiên và khả năng cải thiện liên tục; luồng công việc Agent tùy chỉnh kết hợp các công cụ, plugins, máy chủ MCP, trình duyệt hoặc Shell; triển khai Agent trên phần cứng cục bộ, máy ảo đám mây hoặc cơ sở hạ tầng serverless chi phí thấp; và trường hợp trợ lý lâu dài cần duy trì lịch sử trò chuyện có thể tìm kiếm và kỹ năng học được qua nhiều nền tảng.
Cụ thể hơn, bạn có thể sử dụng nó để trò chuyện trên Telegram trong khi cho phép thực hiện các công việc trên VM đám mây, cấu hình tự động và gửi báo cáo đến bất kỳ nền tảng nào, để Agent thực hiện các nhiệm vụ định kỳ; hoặc kết nối nó với Slack hoặc Discord để hỗ trợ hợp tác AI cho toàn bộ nhóm; hoặc tận dụng tính năng xuất dữ liệu của nó để tạo dữ liệu huấn luyện cho mô hình RL của thế hệ tiếp theo trong việc gọi các công cụ.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia