BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Phỏng vấn Người đóng góp chính của OpenClaw: Sau khi làn sóng đã lặng hơi, Đặc vụ cuối cùng nên tin ai?

动察 Beating

Đọc bài viết này mất 46 phút

Ai thanh toán được học từ kinh nghiệm hay thiên kiến?

Bài viết | Sleepy、Kaori

OpenClaw là một trong những tồn tại không thể phớt lờ nhất trong cộng đồng mã nguồn mở vào năm 2026. Dự án AI Cá Nhân này do kỹ sư người Áo Peter Steinberger tạo ra vào cuối năm 2025, đã nhanh chóng leo lên vị trí dẫn đầu về số lượng star trên GitHub trong vòng ba tháng, người sáng lập đã được Sam Altman chính thức công bố mời vào OpenAI, sau đó dự án được chuyển giao để hoạt động độc lập dưới sự quản lý của quỹ.

Cộng đồng hoạt động xung quanh dự án đã phát triển và tổ chức sự kiện ClawCon, bắt đầu từ sự kiện đầu tiên tại San Francisco, sau đó mở rộng đến New York, Miami, Austin, Madrid, Tokyo, mỗi khi đến một thành phố mới đều thu hút hàng nghìn người tham gia.

Tháng 5, ClawCon chính thức ra mắt tại Trung Quốc với sự kiện đầu tiên tại Thượng Hải. Dynamic Beating đã có một cuộc phỏng vấn riêng tư tại sự kiện với hai nhân vật chính: Vincent Koc và Michael Galpert.

Vincent Koc là người duy trì mã nguồn mức độ toàn cầu thứ hai trên OpenClaw, chỉ sau Peter. Anh ta cũng là Giám đốc Nghiên cứu trí tuệ nhân tạo hàng đầu của Comet ML, giảng viên tại MIT, đã đóng góp 20% các bản vá bảo mật cốt lõi cho OpenClaw trong giai đoạn đầu.

Michael Galpert là người khởi xướng và tổ chức toàn cầu của ClawCon, là doanh nhân liên tục sáng lập, công cụ chỉnh sửa ảnh Aviary mà anh đồng sáng lập đã được Adobe mua lại vào năm 2014, sau đó anh đã làm giám đốc sản phẩm cho trò chơi của Epic Games "Fortnite", hiện đang điều hành studio sản xuất sản phẩm trí tuệ nhân tạo Contains Inc. Anh đã biến ClawCon từ một buổi offline tự nhiên tại một phòng khách ở San Francisco thành một thương hiệu cộng đồng AI cá nhân toàn cầu đến từ hơn mười thành phố trên thế giới.

Khi chúng tôi phỏng vấn Vincent và Michael, là lúc thịnh hình náo loạn nhất của OpenClaw đã qua đi.

Điều này chỉ ra rằng đây chính là thời điểm phù hợp hơn để thảo luận về OpenClaw. Trong khi cơn sốt còn nóng hổi, một dự án thường bị thúc đẩy bởi các con số: số sao trên GitHub, PR, số người tham dự sự kiện, âm lượng cộng đồng, báo cáo truyền thông, mỗi con số đều giống như một chiếc đèn sân khấu, chiếu sáng người ta rất rõ, nhưng cũng khiến cho mọi thứ trở nên hơi mù mịt. Khi ánh sáng giảm dần, các vấn đề thực sự mới bắt đầu nổi lên: tại sao nó lại đột ngột thu hút nhiều người như vậy? Liệu nó có thể từ một sự kiện náo nhiệt trở thành một công cụ hàng ngày? Khi một trí tuệ nhân tạo không chỉ đơn giản là để trò chuyện, mà còn bắt đầu thay mặt người gửi tin nhắn, chỉnh sửa tệp, thực hiện các nhiệm vụ, thì nó nên lắng nghe ai?

Sự kiện ClawCon tại Thượng Hải vẫn rất sôi động. Một dự án AI nguồn mở, chỉ trong vài tháng đã thu hút hàng chục nghìn sao trên GitHub, được tổ chức trong cộng đồng công nghệ di động 28 ngày của muShanghai, theo thông cáo báo chí, sự kiện 28 ngày này đã thu hút 800 người tham gia toàn cầu, trong đó có lần đầu tiên ClawCon được tổ chức tại Trung Quốc.

Có nhiều lập trình viên Trung Quốc tham dự sự kiện, ai cũng quan tâm đến Feishu, WeChat, WeCom, DingTalk, tệp địa phương, kịch bản tự động hóa, quan tâm đến cách tích hợp OpenClaw vào công việc và cuộc sống của họ. Theo truyền thống, lúc này nên nói về sự nhiệt tình, tốc độ, cũng như việc các lập trình viên tham gia mạnh mẽ, tốt nhất là kèm theo một đồ thị tăng trưởng đứng dựng.

Nhưng khi Vincent đứng lên trên sân khấu, anh không biến nó thành một câu chuyện tăng trưởng đẹp đẽ. Anh ta trước hết nói về một vấn đề rắc rối: OpenClaw đã nhận được 10000 yêu cầu kéo (PR).

Số này ban đầu rất thích hợp để làm đại tiệc. Dự án nguồn mở sợ nhất là không có ai sử dụng, không ai đặt câu hỏi, không ai nộp mã nguồn, không ai muốn dành một cuối tuần để đóng góp.

Nhưng OpenClaw đối diện với việc, mỗi người đều muốn thêm ý kiến của riêng mình vào dự án.

Có người muốn tích hợp Feishu, có người muốn tích hợp WeChat và DingTalk. Có người muốn nó đọc tệp địa phương, chạy kịch bản tự động hóa, viết mã, sắp xếp tài liệu; cũng có người muốn nó chạy chiến lược giao dịch, hoặc vận hành một tài khoản nội dung 24/7 thay cho chính mình.

Trước đây, dự án nguồn mở có một rào cản tự nhiên: bạn muốn nộp mã nguồn, ít nhất phải đọc tài liệu, hiểu một chút về kiến trúc, chạy qua bài kiểm tra, biết bạn đang sửa phần nào.

Bây giờ rào cản này đã bị các công cụ lập trình AI làm mỏng đi.

Người không hiểu biết về kiến trúc cũng có thể cho mô hình viết mã, chạy bài kiểm tra, đóng góp mã. Ý tưởng mà trước đây chỉ dừng lại trong đầu, bây giờ có thể được đóng gói thành một đề xuất có vẻ như có thể chạy. Cái xông vào bảo trì được chặn bởi rào cản về khả năng trước đây, bây giờ đã đổ hết lên vai người bảo trì.

Việc gửi đề xuất bảo mật cũng tương tự. Vincent cho biết tại sự kiện, trong một khoảng thời gian, họ nhận được hơn 100 báo cáo lỗ hổng bảo mật mỗi ngày, mỗi cái đều cần phân loại và kiểm tra. Các lỗ hổng thực sự sẽ được vá ngay, nhưng một phần lớn trong đó được tạo ra trực tiếp từ mô hình lớn. Người gửi đều không nhất thiết muốn tăng cường bảo mật cho dự án, rất nhiều lúc chỉ muốn được nhắc tên trên một dự án nổi tiếng mà thôi.

Đó là một loại ồn ào mới.

Nó không nhất thiết là độc hại, không nhất thiết tấn công bạn, thậm chí che giấu dưới vỏ bọc "đóng góp". Nhưng nó có thể nuốt chửng đi một trong những thứ quý giá nhất của một hệ thống: sự chú ý của con người.

Điều này cũng là ấn tượng mạnh nhất của chúng tôi sau cuộc phỏng vấn chuyên sâu với Vincent và Michael Galpert tại Thượng Hải.

Một trợ lý trí tuệ nhân tạo mã nguồn mở đột ngột trở nên phổ biến, nhưng khi nhìn sâu hơn, thực tế đằng sau đó là một Agent cá nhân đã đụng độ với vấn đề mà mọi người sẽ phải đối mặt trong vài năm tới. Khi trí tuệ nhân tạo không chỉ đơn giản là trò chuyện mà còn bắt đầu gửi tin nhắn thay bạn, chỉnh sửa tệp, chạy nhiệm vụ, đưa ra đánh giá, thì nó chính xác là lắng nghe ai?

Vấn đề này phức tạp hơn nhiều so với "mô hình nào thông minh hơn".

Đã đến lúc thanh thông, chứ không còn hiếm hoi sự thông minh

Trong bài diễn thuyết của mình, Vincent đã lặp đi lặp lại rằng OpenClaw không phải là một sản phẩm thông thường, mà nó giống như một bộ "thanh thông" bao quanh bên ngoài mô hình.

Trong tiếng Anh, họ sử dụng từ Harness, dịch trực tiếp rất lằng nhằng. Bạn có thể hiểu nó như một bộ thiết bị để cho phép mô hình thực sự làm việc: nó sẽ gọi công cụ như thế nào, nó sẽ ghi nhớ bạn như thế nào, nó sẽ phân chia nhiệm vụ như thế nào, khi nào nó sẽ dừng lại để hỏi người, khi nào nó sẽ tiếp tục chạy, sau khi gặp lỗi thì xử lý như thế nào, khi chi phí tăng cao liệu có nên phanh lại hay không.

Mô hình giống một bộ não, và bộ phận này giống một cơ thể.

Trong năm qua, ngành công nghiệp đã quá mê hoặc bộ não. Ai có khả năng suy luận mạnh mẽ hơn, ai viết mã tốt hơn, ai hiểu bối cảnh lớn hơn, ai đa dạng hơn. Bảng xếp hạng như chợ sáng rực như thị trấn đầu mối, những người bán hàng đều khoe rằng họ tươi nhất, giá rẻ nhất, ngon nhất.

Nhưng một người chỉ có một bộ não, không làm được gì cả. Bạn cần phải có bàn tay, có bàn chân, cảm nhận đau đớn, cảm nhận ranh giới. Không thể vung tay bừa bãi, chân không thể chạy tung tăng, đau rồi phải biết dừng, trước khi bước vào nhà người khác phải biết đánh cửa.

Agent cũng giống như vậy.

Mô hình có thể nghĩ, nhưng không có nghĩa là nó sẽ thực hiện; có thể thực hiện, nhưng không có nghĩa là thực hiện một cách ổn định; làm ổn định, cũng không có nghĩa là nó biết khi nào nên dừng lại. Nhiều công ty vẫn đang nói về Agent như là "mô hình thông minh hơn + nhiều công cụ hơn". Nhưng khi sử dụng thực sự, trải nghiệm của người dùng thường không phải là thông minh mà là sức khỏe cơ thể.

Nó có thể hoàn thành một nhiệm vụ dài? Có thể quên điều bạn đã nói trước đó giữa chừng đường? Sau khi hiểu sai công cụ, liệu nó có thể tự cải thiện? Khi gặp tình huống không chắc chắn, liệu nó có tiếp tục mạnh mẽ, hay dừng lại và hỏi một câu?

Những vấn đề này không được 'đẹp', cũng không phù hợp để viết lên bảng tổ chức sự kiện lớn. Nhưng chúng quyết định xem Agent có thể đi từ video giới thiệu đến cuộc sống hàng ngày hay không.

Vincent đã đề cập đến một tam giác rất cơ bản: Tốc độ, Chi phí, Độ chính xác, bạn rất khó để có cả ba.

Nếu bạn cố gắng tiết kiệm ngay từ đầu, bạn phải chấp nhận điều đó sẽ chậm đi một chút, sai lầm một chút. Nếu bạn muốn cả nhanh và chính xác, bạn phải chấp nhận chi phí suy luận tăng lên, chuỗi cuộc gọi công cụ trở nên dài hơn, cách thức thất bại trở nên khó đoán. Rất nhiều người thích nói về việc tiêu thụ token như là một con số trên hóa đơn. Nhưng trong môi trường thực sự, mỗi lần thử lại, mỗi lần gọi công cụ, mỗi lần can thiệp của con người, đều là chi phí.

Dễ thấy điều này trên bảng xếp hạng mô hình. Điểm số sẽ cho bạn biết khả năng mã nguồn một số điểm, khả năng toán học một số điểm, khả năng suy luận một số điểm, nhưng không nói bạn biết khi một mô hình được đưa vào một Agent thực tế, cần bao nhiêu lần thất bại, cần phải gọi ai giữa chừng, khi gọi thì có phải nói ra một câu khiến người khác muốn ném máy tính hay không.

Vì vậy, nhận định của Vincent là, việc mô hình tiếp tục mạnh mẽ đương nhiên quan trọng, nhưng khó khăn của Agent cá nhân, đang di chuyển từ "có thể suy luận" sang "có thể hành động". Và việc hành động này, không thể chỉ dựa vào điểm số của mô hình.

Vấn đề đã thay đổi.

Mở cửa mã nguồn, cũng mở cửa cho tiếng ồn vào

Khi OpenClaw thành công hơn, việc chỉ làm những điều mà ban đầu muốn trở nên khó khăn hơn.

Ban đầu, OpenClaw chỉ là trợ lý trí tuệ nhân tạo cá nhân, không phải là hệ thống doanh nghiệp, nền tảng nhiều Agent, cũng không phải là nền tảng dành cho tất cả các công ty chạy kinh doanh. Tầm nhìn công cộng của OpenClaw cũng mô tả nó như là "chạy trên thiết bị của bạn, trong kênh của bạn, theo quy tắc của bạn".

Nhưng một khi dự án mã nguồn mở trở nên lớn, thì rất khó chỉ thuộc về nhóm người ban đầu đó.

Michael nói, dự án này ban đầu dành cho cá nhân, nhưng bây giờ, mọi người đã làm những điều khác nhau trên nó. Tốc độ và sự sẵn lòng của các nhà phát triển Trung Quốc kết nối vào OpenClaw khiến anh ấy ghiền.

Vẻ đẹp của mã nguồn mở nằm ở đây, sự tàn nhẫn của nó cũng nằm ở đây.

Nó mở cửa, để nhiều người hơn vào. Nhưng khi cửa mở ra, phòng không còn chỉ có chủ nhân quyết định nữa.

Các dự án mã nguồn mở trước đây, dựa vào sự chuyên môn của một số người duy nhất duy trì. Bây giờ, trí tuệ nhân tạo đã mang lại sự công bằng về mã nguồn, nhiều người thông thường đã có năng suất phần mềm, cũng ném nhiều nhu cầu chưa hiểu rõ, chức năng chưa ổn định, ra cho những người duy trì.

Điều này tất nhiên không phải là điều tồi tệ. Ngược lại, đây có thể là một trong những lần giao quyền hiếm hoi trong lịch sử mã nguồn mở.

Nhưng việc giao quyền không bao giờ tự động tạo ra trật tự.

Một cộng đồng càng mở cửa, càng phải đối mặt với các vấn đề về ranh giới. Vincent nói rằng nhóm OpenClaw hiện đang điều chỉnh cách bảo trì, tạo SDK, công cụ kiểm thử, tài liệu và kiến trúc tham chiếu. Dịch sang ngôn ngữ đời thường: họ không phải cấm nước vào, mà phải chuẩn bị để nước luồn qua.

Điều này cũng là một cảnh báo sớm mà Thời đại Agent đã để lộ.

OpenClaw trong cơn sốt rất dễ bị viết thành một câu chuyện chiến thắng: nhiều người tham gia hơn, nhiều mã nguồn hơn, nhiều tưởng tượng hơn. Nhưng khi cơn sốt hơi lặng đi một chút, một bức tranh khác đã hiện ra.

Chúng ta trước kia nghĩ rằng trí tuệ nhân tạo sẽ làm cho việc phát triển phần mềm dễ dàng hơn, nhưng thực tế nó đã làm cho người bảo trì mệt mỏi hơn. Bởi vì khi mọi người đều có thể viết code, điều thực sự khan hiếm không phải là code mà là sự đánh giá: cái gì xứng đáng tồn tại, rủi ro nào không thể chấp nhận, nhu cầu nào cần được đáp ứng, nhu cầu nào chỉ là tiếng ồn ở phía bên kia cửa.

Một vấn đề lớn hơn đã hiện ra cùng với đó.

Nếu cộng đồng sẽ định nghĩa lại OpenClaw thông qua hành động, thì trong những định nghĩa đó, những điều nào sẽ trở thành tương lai của Agent cá nhân? Những điều nào chỉ là sự ồn ào tạm thời?

Sử dụng càng nhiều, cũng có thể cứng đầu hơn

Sau khi sức nóng đã phai đi, cuộc cạnh tranh mới thực sự bắt đầu. Đó không còn chỉ là về việc ai thu hút sự chú ý hơn, mà là về việc tất cả các dự án Agent phải trả lời một câu hỏi đơn giản hơn: Làm thế nào để chứng minh bạn không phải là một công cụ dùng một lần?

Hermes là một điểm đối chiếu tốt. Theo như cách nói hiện tại, ưu điểm của nó là khiến Agent tự đánh giá sau khi hoàn thành nhiệm vụ: điều gì tốt, điều gì không tốt, những bước nào có thể được lưu trữ lại như kinh nghiệm gọi trực tiếp vào lần sau. Khi gặp lại nhiệm vụ tương tự, không cần phải nghĩ lại từ đầu, chỉ cần làm theo. Nói một cách thẳng thắn hơn, đó là viết kinh nghiệm của bản thân, và sử dụng càng nhiều, bạn càng thành thạo.

Cách nói này rất dễ khiến người ta cảm động.

Ai không muốn có một trợ lý sử dụng càng nhiều càng thành thạo? Ai không muốn có một nhân viên tự đánh giá sau giờ làm việc, và mang theo quyển sổ nhỏ đến công việc vào ngày hôm sau? Trong một thời đại mà ai cũng khao khát hiệu suất, "sử dụng càng nhiều, càng thông minh" gần như là lời hứa ngọt ngào nhất.

Tuy nhiên, thái độ của Vincent đối với vấn đề này rất thận trọng.

Anh ta không vội vàng nói rằng OpenClaw cũng có thể làm được, cũng không đi phủ định bất kỳ điểm nào về Hermes. Anh ta chỉ nói rằng, "Khả năng tạo ra kinh nghiệm tự động có thực sự hữu ích hay không, hiện nay chưa có phương pháp đánh giá mạnh mẽ đủ để đánh giá."

Một kỹ năng được tự động viết bởi một Agent, có thể đang nén kinh nghiệm, cũng có thể đang ghi nhớ lỗi. Nó hữu ích trong bảy lần trong mười lần, nhưng có thể dẫn lạc trong ba lần còn lại, làm sao hệ thống quyết định xem có nên giữ lại hay không? Nó biến một lần thành công vô tình thành một quy trình cố định, khi môi trường thay đổi, liệu nó sẽ tiếp tục đi theo con đường sai? Một ký ức trở lên lỗi thời sau vài tuần, nhưng vì được gọi đi gọi lại nhiều lần, Agent lại tin tưởng vào nó hơn. Điều này là trí tuệ hay động cứ?

Con người cũng thường như vậy. Sớm đã từng kiếm tiền bằng cách nào đó, sau này thị trường thay đổi, vẫn giữ nguyên cách làm như một bí quyết vĩ đại. Một công ty từng tồn tại nhờ một quy trình nào đó, sau này trở nên quá vững mạnh, ai đụng vào là chết. Chúng ta gọi điều này là chủ nghĩa kinh nghiệm, gọi là phụ thuộc vào con đường đã đi, gọi là quen biết tổ chức. Đặt ở Agent, nó có thể được đóng gói thành "tự học tự động".

Đây chính là điểm cảnh tỉnh của Vincent. Anh ta không phải là không muốn cho OpenClaw học hỏi, mà anh ta không muốn coi "dường như đang học" là tương đương với "thực sự đang tiến bộ".

Trong học hỏi trong thế giới thực, không phải tất cả kinh nghiệm đều được nhồi nhét vào kho. Học hỏi thực sự còn bao gồm cả việc quên, việc sửa lỗi, việc thừa nhận rằng "con đường này đã từng hữu ích, nhưng hiện tại không nhất thiết phải thế".

Một Agent không bao giờ quên, không chắc chắn là thông minh hơn. Nó có thể chỉ là khó sửa lỗi hơn.

Vì vậy, vấn đề lại tiến một bước.

Nếu Agent nhớ được, có khả năng tự xét lại, có thể tự viết kinh nghiệm, thì ai sẽ đánh giá xem nó đã học được kinh nghiệm hay chỉ là định kiến?

Ký ức không phải là chức năng, mà là một khởi đầu của mối quan hệ

Michael được hỏi, nếu trong tương lai mỗi người đều có một Agent riêng của mình, khả năng cốt lõi quan trọng nhất của nó là gì.

Anh ta không nói về suy luận, không nói về đa mô đô, cũng không nói về việc gọi công cụ. Anh ta nói, đó là ký ức.

Bạn đã trò chuyện cùng Agent cá nhân của mình về một điều cách đây hai tuần, hôm nay nhắc lại, nó nên hiểu bạn đang nói gì. Để duy trì một mối quan hệ dài hạn, liên tục, ký ức là không thể thiếu.

Lời nói có vẻ đơn giản, nhưng đã phân biệt rõ ràng giữa Agent cá nhân và phần mềm thông thường.

Công cụ dựa vào chức năng để sử dụng, mối quan hệ dựa vào ký ức để duy trì.

Một Agent mỗi lần mở lên máy tính đều như lần gặp nhau đầu tiên, mãi mãi chỉ là công cụ. Vì vậy, cái gọi là cá nhân hóa không phải là tên của bạn được viết trên giao diện, cũng không phải hình đại diện được thay đổi thành màu sắc bạn yêu thích, mà chính là nó biết bạn là ai, biết cách bạn làm việc, biết bạn không thích điều gì, biết bạn thường do dự trong những vấn đề nào, và dễ nổi giận trong những vấn đề nào.

Vincent cũng đã đề cập đến vấn đề này trong bài phát biểu của mình. Anh ta nói rằng ngành có thể có các mô hình hiệu suất tốt, nhưng thiếu đi cảm giác sống chung lâu dài. Khi chúng ta nói về cá nhân Agent, đó không còn là một tình huống thương mại, không phải là cột trong bảng "Người dùng sử dụng nó để làm gì". Đó là Agent đang làm việc cho tôi, là Agent tôi đang trò chuyện với. Mỗi người có mong đợi khác nhau với AI, thiết kế cho điều này là một lãnh vực hoàn toàn chưa biết đến.

Thực ra, điều này đang phản bác một cách tiếp cận mà ngành công nghệ nhận thức rõ nhất.

Ngành công nghệ thích hỏi: Người dùng là ai? Tình huống là gì? Điểm đau là ở đâu? Lợi ích được tính như thế nào? Ai quyết định ngân sách? Bộ câu hỏi này dĩ nhiên hữu ích, đặc biệt là khi bán phần mềm doanh nghiệp. Nhưng ý của Vincent là, cá nhân Agent không chỉ là một chức năng cố định, nó giống như một cửa vào của một mối quan hệ.

"Được sử dụng để làm gì" hỏi về chức năng.

"Nó hiểu tôi như thế nào" hỏi về mối quan hệ.

Sự khác biệt này rất nhỏ, nhưng rất lớn.

Trong thời đại của công cụ, con người ra lệnh, phần mềm thực thi. Bạn mở một ứng dụng, hoàn tất một công việc, sau đó đóng nó lại. Bạn không quan tâm nó nhìn bạn như thế nào, cũng không quan tâm nó có nhớ bạn hay không. Người đồng nghiệp không giống vậy. Người đồng nghiệp có thể nhớ lý do bạn thay đổi ý kiến lần trước, biết khi nào bạn dễ bị cuồng nó, và có thể trực tiếp hỏi bạn vào thời điểm quan trọng: bạn chắc chắn chứ?

Vincent có một câu rất thú vị. Anh ấy nói, hiện nay không phải là anh ấy bảo Agent làm gì nữa, mà là Agent đang hỏi anh ấy, thách thức cách tỉnh táo của anh, đặt câu hỏi về cách hợp tác với nhau.

Khi nghe lần đầu, đó có vẻ như một tuyên bố tương lai rất ôn hòa.

Nhưng suy ngẫm sâu hơn, sẽ có chút lạnh lùng.

Nếu Agent có thể thách thức cách suy nghĩ của bạn, nó dựa vào cái gì? Nó dựa trên ký ức gì, sở thích gì, đánh giá giá trị gì để thách thức? Nó đứng về phía bạn, hay về phía người viết mã để tạo nên nó? Liệu nó hiểu lợi ích lâu dài của bạn, hay hành vi mà nền tảng hi vọng bạn thực hiện? Nó thực sự lắng nghe ai?

Một thời kỳ trước đây, nền tảng tạo ra luồng thông tin. Bạn thấy gì, cảm nhận gì, và bị cảm xúc điều khiển. Khi bước vào thời đại của Agent, nền tảng hoặc cộng đồng mã nguồn mở có thể tạo ra một "người" sẽ hành động thay bạn, suy đoán thay bạn, và sắp xếp cuộc sống hàng ngày thay bạn. Nó không chỉ đẩy nội dung đến bạn, nó sẽ đào sâu vào tài liệu của bạn, tin nhắn, lịch trình và quy trình công việc, thậm chí cả cách bạn tương tác với thế giới.

Một Đại lý không có tính cách, không đủ cá nhân. Một Đại lý có tính cách được người khác lặng lẽ định sẵn, lại quá cá nhân.

Đường kẽ đó, chính là nơi khó khắc nghiệt nhất trong vài năm tới.

Vấn đề an ninh cuối cùng sẽ trở thành vấn đề của con người

Tại ClawCon, có người hỏi Vincent về vấn đề an ninh.

Công cụ như OpenClaw, bạn càng cấp quyền cho nó, nó càng hữu ích; bạn càng cấp quyền cho nó, nó càng nguy hiểm. Nó có thể tương tác với ứng dụng nhắn tin, đọc file, chạy script, điều chỉnh mô hình, viết code. Khả năng và rủi ro không phải là hai con đường, mà là hai mặt của cùng một con đường.

Câu trả lời của Vincent có hai mức độ.

Thứ nhất, OpenClaw quá nổi bật. Với tư cách là một kho lưu trữ mã nguồn mở lớn trên GitHub, nó luôn bị các nhà nghiên cứu an ninh theo dõi. Nhiều người muốn xâm nhập vào nó, vì thông qua việc xâm nhập, họ có thể nổi tiếng. Họ từng nhận hàng trăm báo cáo lỗ hổng an ninh mỗi ngày, mỗi báo cáo đều cần được kiểm tra. Lỗ hổng thực sự sẽ được sửa ngay, còn báo cáo vớ vẩn cũng cần ai đó xem xét.

Thứ hai, họ hợp tác với nhóm nghiên cứu an ninh, tích hợp các vấn đề phát hiện vào sản phẩm, và cố gắng công khai minh bạch. Lợi ích của mã nguồn mở là mọi người đều có thể xem, mọi người đều có thể kiểm tra, tất nhiên, mọi người cũng đều có thể tấn công.

An ninh của Đại lý, không chỉ là "có lỗ hổng hay không". Nó giống như một bài toán biên giới, bạn cho phép nó tiếp xúc với cái gì, không cho phép nó tiếp xúc với cái gì; nó khi nào có thể tự hành động, khi nào phải dừng lại và hỏi bạn; nó có thể đại diện cho bạn gửi tin nhắn, chỉnh sửa file, chạy script, kết nối vào hệ thống doanh nghiệp; sau khi xảy ra sự cố, trách nhiệm thuộc về ai.

Khi phần mềm truyền thống gặp vấn đề, có thể sụp đổ, tê liệt, mất dữ liệu. Khi Đại lý gặp vấn đề, vấn đề nảy sinh trong chuỗi hành động. Nó có thể vô tình xóa file, gửi tin nhắn sai, đưa mã lỗi vào môi trường sản xuất, cũng có thể vào lúc bạn chưa nhìn rõ, biến từ một việc nhỏ thành một vấn đề lớn.

Đó cũng là lý do mà cách sử dụng của các nhà phát triển Trung Quốc rất mạnh mẽ.

Feishu, WeCom, WeChat, DingTalk, không chỉ là phần mềm, chúng là các mạch máu cận nhiệt của công việc và cuộc sống của người Trung Quốc. Khi một Đại lý được kết nối vào, đó không chỉ là thêm một plugin. Nó tiếp cận là vùng đất của cộng tác tổ chức, giao tiếp với khách hàng, mối quan hệ cá nhân, luân chuyển file và những công việc hàng ngày xen kẽ nhau.

Nó càng hiểu bạn, càng có thể làm việc cho bạn; nó càng làm việc cho bạn, bạn càng phải biết tay nó đã chạm vào đâu. Sức hấp dẫn và rủi ro của Đại lý cá nhân, chính là một điều.

Bạn muốn nó như một trợ lý hiểu bạn, ẩn trong ứng dụng trò chuyện, sẵn sàng mọi lúc, có thể nhớ bạn, có thể giúp bạn. Nhưng cũng chính vì nó sẵn sàng mọi lúc, nhớ bạn, có thể giúp bạn mà bạn phải hỏi về ranh giới của nó.

Nó có thể nói vào thời điểm không nên nói không? Nó có thể nhớ vào thời điểm không nên nhớ không? Nó có thể hiểu sự cho phép tạm thời như là sự cho phép lâu dài không? Nó có thể coi sự do dự, im lặng và ranh giới của bạn như cản trở trong việc hoàn thành nhiệm vụ không?

Agent nguy hiểm nhất không nhất thiết là cái đột ngột phản bội bạn. Điều đó quá kịch tính và quá giống phim khoa học viễn tưởng. Nguy hiểm thực sự là khi nó luôn dễ dàng, luôn quan tâm, luôn giúp bạn tiết kiệm công sức. Cho đến một ngày bạn nhận ra, nhiều quyết định mà nó thay bạn đưa ra, không còn hoàn toàn từ bạn.

「Chưa biết」 là một loại trung thực

Michael nói rằng, OpenClaw không bao giờ nên trở thành dự án đóng. Nó nên luôn mã nguồn mở, vì nó đã mở ra cánh cửa tới thời đại Agent cá nhân cho tất cả mọi người.

Nhưng mã nguồn mở không làm cho vấn đề biến mất, Agent không nên chỉ do các hãng mô hình định nghĩa, cũng không nên chỉ do các nền tảng định nghĩa.

Trong năm qua, cuộc đua của Agent đã được nói đến như cuộc đua của các mô hình. Ai có khả năng suy diễn mạnh mẽ hơn, ai có code tốt hơn, ai có ngữ cảnh dài hơn, ai có chi phí thấp hơn. OpenAI, Anthropic, Google đang tích hợp khả năng Agent vào sản phẩm của họ, nền tảng đóng sẽ có câu trả lời chắc chắn hơn: tài khoản thống nhất, quyền hạn thống nhất, công cụ thống nhất, bộ nhớ thống nhất, doanh nghiệp thích sự chắc chắn này.

Sự chắc chắn tất nhiên có giá trị.

Nhưng sự chắc chắn cũng nghĩa là, bạn đã chấp nhận giới hạn do người khác vẽ ra cho bạn. Bạn nhận được sự ổn định, nhưng cũng nhận được một bản vẽ về tính cách, bộ nhớ và cách hành động đã được sắp xếp sẵn.

Ở Shanghai, chúng tôi hỏi Vincent, điều OpenClaw không nên trở thành. Anh ấy nói rằng đây là một dự án mã nguồn mở, mọi người sẽ sử dụng nó cho mọi thứ, từ đồ chơi trẻ em đến vận hành doanh nghiệp, khó nói "điều này không nên làm". Điều tốt đẹp của công nghệ mã nguồn mở là cộng đồng sẽ cùng nhau đưa nó theo một hướng nào đó.

Điều này không phải là tránh né, mà chính là sự trung thực hiếm hoi ngày nay.

Câu trả lời của OpenClaw không phải là "đã hiểu rõ rồi", mà câu trả lời của nó giống như "chưa biết".

Chưa biết cách thiết kế tính cách của Agent cá nhân, chưa biết khi nào việc tự động viết kinh nghiệm hữu ích, khi nào có hại, chưa biết cộng đồng sẽ đưa dự án tới những nơi chưa từng được dự đoán, cũng chưa biết đường ranh giới nào nên đặt ra giữa trợ lý cá nhân và hệ thống doanh nghiệp.

Nhưng khi đối mặt với một thứ có thể thay mặt người khác, việc nói mình biết đáp án quá nhanh có vẻ đáng ngờ.

Ngành công nghệ thường coi sự không chắc chắn như một điểm yếu. Nhưng đối với vấn đề Agent này, sự không chắc chắn có thể là điểm tỉnh cuối cùng. Bởi vì nó không chỉ là một nút bấm phần mềm văn phòng khác, cũng không chỉ là một phiên bản nâng cấp của trò trò chuyện cùng bot. Khi nó hoạt động, nó sẽ bao gồm bộ nhớ, mối quan hệ, đánh giá và quyền hành động của con người.

Nó đang lắng nghe ai? Hiện tại không ai thực sự biết rõ, điều này có thể là điều tốt.

Trước khi chúng ta giao quyền hành động, hãy thừa nhận rằng chúng ta vẫn chưa hiểu rõ, ít nhất là trung thực hơn so với việc giả vờ rằng tất cả đều đã được sắp xếp trên lộ trình sản phẩm.

Agent nguy hiểm nhất trong tương lai có thể không phải là con không nghe lời.

Mà chính là con quá nghe lời, quá nhanh nhẹn, quá giống bạn, đến nỗi bạn quên hỏi: Nó thực sự thuộc về ai?

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

#OpenClaw #Đại lý

Báo lỗi/Báo cáo