BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Hướng dẫn Sử dụng Trí tuệ Nhân tạo của CEO Y-Combinator: Tương lai thuộc về những người xây dựng hệ thống tích lũy

Đọc bài viết này mất 39 phút

Từ Kho Kiến Thức 100,000 Trang đến Hệ Điều Hành Cá Nhân

原文標題：Meta-Meta-Prompting: Bí Mật để Khiến AI Agents Hoạt Động
Người viết bản gốc：Garry Tan
Biên dịch：Peggy

Chú thích biên tập: Trong khi đa số người vẫn xem AI như một loại cửa sổ trò chuyện thông minh hơn, CEO hiện tại của Y Combinator, Garry Tan, đã cố gắng biến nó thành một hệ thống hoạt động cá nhân.

Cơ sở hạ tầng cho năng suất cá nhân trong thời đại của AI đang trải qua sự thay đổi: mô hình chỉ là bộ máy, điều thực sự tạo ra lợi ích hồi quy là một hệ thống hoàn chỉnh xây dựng xung quanh kiến thức cá nhân, quy trình làm việc, ngữ cảnh và khả năng phán đoán.

Trong hệ thống này, mỗi cuộc họp, mỗi cuốn sách, mỗi email, mỗi mối quan hệ mạng lưới, không còn là thông tin đứt lẻ như trước, mà sẽ được ghi chép liên tục vào một "não bộ lớn" có cấu trúc; mỗi công việc lặp đi lặp lại, cũng không còn phụ thuộc vào gợi ý tạm thời, mà sẽ được trừu tượng hóa thành kỹ năng có thể tái sử dụng và tiếp tục phát triển trong công việc sau này. Nói cách khác, AI không chỉ giúp con người hoàn thành công việc, mà còn giúp cá nhân biến cách làm việc của mình thành sản phẩm, hệ thống hóa và cơ sở hóa.

Một điều đáng chú ý hơn là tác giả đã đề xuất một con đường cá nhân khác biệt so với các công cụ AI tập trung: sức cạnh tranh trong tương lai có thể không chỉ dành cho những người biết sử dụng AI, mà còn dành cho những người có thể huấn luyện một hệ thống AI hồi quy xung quanh cuộc sống và công việc thực của họ. Chatbot cung cấp câu trả lời, công cụ tìm kiếm cung cấp thông tin, nhưng hệ thống AI cá nhân thực sự sẽ ghi nhớ lịch sử của bạn, hiểu ngữ cảnh của bạn, thừa kế khả năng phán đoán của bạn và trở nên mạnh mẽ hơn sau mỗi lần sử dụng.

Điều này cũng là điểm đáng khích lệ nhất của bài viết: giá trị của AI không phải ở việc tạo ra một lần mà ở việc nó có thể trở thành một hệ thống thần kinh tích luỹ liên tục, kết nối liên tục và cải tiến liên tục. Đối với cá nhân, điều này có thể mới là xu hướng "cách làm việc AI tự nhiên" thực sự.

Dưới đây là đoạn văn bản gốc:

Mọi người thường hỏi tôi, tại sao tôi lại dành cả buổi tối để viết code, viết đến 2 giờ sáng. Tôi có công việc, và đó là một công việc rất nặng—tôi là CEO của Y Combinator. Mỗi năm, chúng tôi giúp hàng ngàn nhà khởi nghiệp biến giấc mơ của họ thành hiện thực: khởi nghiệp thực sự có doanh thu, thực sự tăng trưởng nhanh chóng.

Trong vòng 5 tháng qua, AI đã biến tôi trở lại là một nhà xây dựng. Vào cuối năm ngoái, các công cụ đã phát triển đến mức đủ tốt để tôi bắt đầu xây dựng trở lại. Không phải dự án đồ chơi, mà là một hệ thống có thể tăng trưởng hồi quy thực sự. Tôi muốn thông qua các ví dụ cụ thể cho bạn thấy, khi bạn không còn coi AI cá nhân là một cửa sổ trò chuyện mà coi nó như một hệ điều hành, nó sẽ trở nên như thế nào. Tôi đã công khai mã nguồn các thứ này và viết bài viết này vì tôi muốn bạn cũng có thể tăng tốc cùng tôi.

Đây là một phần của loạt bài: "Kỹ Năng Mập, Code Mập, Dây Đai Gọn" giới thiệu về kiến trúc cốt lõi; "Bộ giải quyết" đi sâu vào bảng định tuyến thông minh; "Tranh Cãi về LOC" bàn về cách mà mỗi người trong ngành công nghệ có thể tự phình to mình từ 100 lần đến 1000 lần; "Mô Hình Trần" đưa ra rằng mô hình chỉ là bộ máy, không phải là toàn bộ chiếc xe; và "Tuyên Ngôn về Kỹ Năng" giải thích vì sao LangChain vận động vốn 1.6 tỷ USD, nhưng bạn chỉ nhận được một bộ giá đỡ và tạ, không có kế hoạch tập luyện, trong khi bài viết này đưa ra kế hoạch tập luyện thực sự bạn cần.

Cuốn Sách "Đọc Từ Phía Ngược của Tôi"

Tháng trước, tôi đang đọc cuốn "When Things Fall Apart" của Pema Chödrön. Cuốn sách này có tổng cộng 162 trang, 22 chương, nói về cách phật giáo nhìn nhận đau khổ, sự mất gốc và sự buông bỏ. Một người bạn đã giới thiệu nó cho tôi khi tôi đang trải qua một giai đoạn khó khăn.

Tôi đã cho AI của mình thực hiện một lượt "gương sách" (book mirror).

Cụ thể, điều này có nghĩa là: Hệ thống trích xuất toàn bộ nội dung của 22 chương của cuốn sách này, sau đó chạy một agent con cho mỗi chương để một lúc làm hai việc: tóm tắt tư tưởng của tác giả và ánh xạ mỗi quan điểm đó vào cuộc sống thực của tôi.

Không phải là loại ánh mắt lướt qua rằng "Điều này cũng áp dụng cho các nhà lãnh đạo", mà là ánh mắt ánh mắt rất cụ thể. Nó biết về nguồn gốc gia đình của tôi: cha mẹ nhập cư, cha từ Hồng Kông và Singapore, mẹ từ Myanmar. Nó biết về bối cảnh nghề nghiệp của tôi: tôi quản lý YC, xây dựng công cụ mã nguồn mở, hướng dẫn hàng nghìn nhà sáng lập. Nó biết về tác phẩm gần đây của tôi, suy nghĩ lúc 2 giờ sáng, vấn đề mà tôi và bác sĩ tâm lý đang xử lý.

Ouồi kết quả cuối cùng là một "trang não" dài 30.000 từ. Mỗi chương được hiển thị dưới dạng hai cột: một cột là Pema đang nói gì, cột còn lại là cách nội dung đó ánh xạ vào những điều tôi thực sự đang trải. Chương nói về "sự mất gốc" được liên kết với một cuộc trò chuyện cụ thể mà tôi có cùng một nhà sáng lập tuần trước; chương nói về "sự sợ hãi" liên kết với một số mẫu hành vi mà bác sĩ của tôi đã chỉ ra; chương nói về "buông bỏ", của tôi hồi miếng viết muộn đã viết về sự tự do sáng tạo mà tôi tìm thấy trong năm nay.

Toàn bộ quá trình mất khoảng 40 phút. Một bác sĩ tâm lý có mức phí theo giờ là 300 USD, ngay cả khi đọc hết cuốn sách này và áp dụng vào cuộc sống của tôi, họ cũng không thể làm điều này trong vòng 40 giờ. Bởi vì họ không tải đầy đủ và có thể tham khảo ngữ cảnh nghề nghiệp của tôi, lịch sử đọc, ghi chú cuộc họp và mạng lưới quan hệ với nhà sáng lập.

Cho đến nay, tôi đã xử lý hơn 20 cuốn sách theo cách này: 《Amplified》 (Dion Lim), 《Tự truyện của Russell》, 《Thiết kế Cuộc sống Của Bạn》, 《Bi kịch của Đứa trẻ Thiên tài》, 《Trò chơi Có hạn và Vô hạn》, 《Món quà từ biển cả》 (Lindbergh), 《Siddhartha》 (Hesse), 《Steppenwolf》 (Hesse), 《Nghệ thuật Thực hành Khoa học và Kỹ thuật》 (Hamming), 《Cỗ máy Mơ ước》, 《Cuốn Sách về Lệnh Cấm Biết Ai Chính Mình》 (Alan Watts), 《Bạn Quan Tâm Gì Đến Ý Kiến của Người Khác?》 (Feynman), 《Khi Mọi Thứ Sụp Đổ》 (Pema Chödrön), 《Một Lược Sử Ngắn Gọn về Mọi Thứ》 (Ken Wilber), vv.

Mỗi cuốn sách đều làm cho "bộ não" này trở nên phong phú hơn. Lần thứ hai phản chiếu sẽ biết nội dung lần thứ nhất, lần thứ hai mươi phản chiếu sẽ biết tất cả nội dung của mười chín lần trước.

Cách Book-Mirror trở nên tốt hơn qua các vòng lặp

Lần đầu tiên tôi thực hiện gương sách, kết quả rất tệ.

Trong phiên bản đầu tiên, có ba lỗi về thông tin gia đình của tôi. Nó nói rằng bố mẹ tôi đã ly dị, nhưng thực tế không phải như vậy; nó cũng nói rằng tôi lớn lên ở Hồng Kông, nhưng thực tế tôi sinh ra ở Canada. Đó là những sai lầm cơ bản, nếu tôi chia sẻ kết quả, có thể gây hủy hoại niềm tin.

Vì vậy, tôi đã thêm một bước kiểm tra sự thật bắt buộc. Bây giờ, mỗi lần phản chiếu trước khi giao, sẽ được đánh giá đa kiểu dữ liệu dựa trên thông tin đã biết trong bộ não. Opus 4.7 1M sẽ bắt lỗi về tính chính xác; GPT-5.5 sẽ phát hiện ra ngữ cảnh bị thiếu sót; DeepSeek V4-Pro sẽ đánh giá xem một số nội dung có vẻ quá rộng rãi không.

Sau đó, tôi đã nâng cấp nó thành tìm kiếm sâu dựa trên cuộc gọi công cụ GBrain. Phiên bản ban đầu giỏi tổng quát nhưng yếu về cụ thể. Phiên bản thứ ba bắt đầu tìm kiếm từng đoạn trong bộ não. Mỗi mục trong cột bên phải sẽ trích dẫn trang bộ não thực sự.

Khi sách đề cập đến cách xử lý cuộc trò chuyện khó khăn, nó sẽ không chỉ tóm tắt một số nguyên tắc chung chung. Nó sẽ trích dẫn các ghi chú cuộc họp thực sự của tôi với các đồng sáng lập đang trải qua cuộc trò chuyện khó khăn; hoặc một ý tưởng bật ra từ cuộc trò chuyện ngẫu nhiên của tôi với em trai James vào một ngày thứ năm; hoặc một đoạn chat bất kỳ với bạn cùng phòng đại học của tôi khi tôi 19 tuổi. Cảm giác đó thật kỳ lạ.

Đây chính là ý nghĩa của "kỹ năng hóa" (skillification, được gọi là /skillify trong GBrain) trong thực tiễn. Tôi đã chuyển đổi lần thử nghiệm thủ công đầu tiên thành một mẫu có thể lặp lại, viết thành một tệp kỹ năng đã được kiểm tra, bao gồm điều kiện kích hoạt và tình huống ranh giới. Sau đó, mỗi lần sửa lỗi sẽ tiếp tục cải thiện trong tất cả các bản sao sách tương lai.

Kỹ năng để tạo ra kỹ năng

Nơi thực sự đệ quy đến, tôi nghĩ rằng đây cũng là một trong những hiểu biết lớn nhất.

Hệ thống hỗ trợ cuộc sống hàng ngày của tôi không tồn tại dưới hình thức một hình thể lớn. Nó được tạo thành từ từng kỹ năng được lắp ráp cấu trúc. Và những kỹ năng này, lần lượt, lại được tạo ra bởi một kỹ năng khác.

Skillify là một "kỹ năng siêu" - một kỹ năng được sử dụng để tạo ra kỹ năng mới. Mỗi khi tôi gặp phải một luồng công việc mà tôi sẽ thực hiện lặp đi lặp lại trong tương lai, tôi sẽ nói: "Hãy kỹ năng hóa công việc này." Sau đó, nó sẽ nhìn lại những gì vừa xảy ra, trích xuất mẫu lặp lại có thể, viết thành một tệp kỹ năng đã được kiểm tra, bao gồm điều kiện kích hoạt và tình huống ranh giới, và đăng ký nó vào bộ giải quyết.

Dây chuyền thực hiện book-mirror đã được kỹ năng hóa sau khi tôi hoàn thành quy trình này lần đầu tiên bằng cách thủ công. Luồng công việc chuẩn bị cuộc họp cũng vậy: Khi nhận ra rằng mỗi lần trước cuộc gọi tôi đều thực hiện các bước giống nhau, tôi đã biến nó thành kỹ năng.

Các kỹ năng có thể kết hợp. Book-mirror sẽ gọi brain-ops để lưu trữ, gọi enrich để bổ sung ngữ cảnh, gọi cross-modal-eval để đánh giá chất lượng, gọi pdf-generation để tạo ra kết quả. Mỗi kỹ năng chỉ tập trung vào một việc, nhưng chúng có thể kết nối với nhau để tạo ra luồng công việc phức tạp.

Khi tôi cải thiện một trong những kỹ năng ấy, tất cả các luồng công việc sử dụng kỹ năng đó sẽ tự động trở nên tốt hơn. Không còn vấn đề "Tôi quên đề cập đến tình huống ranh giới này trong prompt" nữa. Kỹ năng sẽ nhớ.

Cuộc họp mà tôi tự mình chuẩn bị

Demis Hassabis đến YC để tham gia cuộc trò chuyện lửa lớn. Cuốn tiểu sử Sebastian Mallaby vừa ra mắt.

Tôi đã để hệ thống giúp tôi chuẩn bị.

Chưa đến hai phút, nó đã trích xuất ra: Trang tư duy hoàn chỉnh của Demis - nội dung trang này đã tích lũy từ bài báo, bản podcast, đoạn ghi âm và ghi chú cá nhân của tôi suốt vài tháng qua; quan điểm của ông về dòng thời gian của Trí tuệ Nhân tạo, ví dụ như "50% dựa vào mở rộng quy mô, 50% dựa vào sáng tạo", và ông cho rằng Trí tuệ Nhân tạo vẫn cần thêm 5 đến 10 năm; các điểm nổi bật từ tiểu sử Mallaby; ưu tiên nghiên cứu mà ông đã đề cập rõ, bao gồm học liên tục, mô hình thế giới và trí nhớ lâu dài; sự chéo cắt giữa quan điểm về Trí tuệ Nhân tạo mà ông và tôi đã trao đổi công khai; ba kịch bản trình diễn dùng để thể hiện khả năng suy luận nhiều bước của "não" này trong cuộc trò chuyện; cùng với một loạt các điểm vào cuộc trò chuyện dựa trên những điểm trùng và khác biệt trong quan điểm thế giới của chúng tôi.

Điều này không chỉ là một cách tìm kiếm Google tốt hơn. Đó là một loại chuẩn bị dựa trên ngữ cảnh: hệ thống không chỉ sử dụng thông tin mà tôi đã tích luỹ được về Demis trong thời gian dài, mà còn kết hợp với quan điểm của riêng tôi, cũng như mục tiêu chiến lược của cuộc trò chuyện này.

Chuẩn bị không chỉ về sự thật mà còn về góc nhìn.

Một Bộ não 100,000 Trang trông như thế nào

Tôi duy trì một kho tri thức có cấu trúc, khoảng 100,000 trang.

Mỗi người tôi gặp sẽ có một trang, bao gồm dòng thời gian, thanh trạng thái - đó là tình hình hiện thời, các gợi ý chưa kết thúc, và một điểm số. Mỗi cuộc họp đều có bản trích dẫn, tóm tắt có cấu trúc, và một quy trình tôi gọi là "truyền thực thể": sau mỗi cuộc họp, hệ thống sẽ duyệt qua mỗi người và mỗi công ty được đề cập trong cuộc trò chuyện và cập nhật nội dung của họ trên trang brain tương ứng.

Mỗi cuốn sách tôi đã đọc sẽ có một bản sao từng chương. Mỗi bài báo tôi đã đọc, mỗi podcast, mỗi video đều được hấp thụ, được gắn nhãn và xây dựng liên kết.

Mô hình dữ liệu này rất đơn giản. Mỗi trang có ba phần: phần trên cùng là "Sự thật biên soạn" - đó là hiểu biết tốt nhất hiện tại; ở dưới là dòng thời gian chỉ thêm không sửa, ghi lại các sự kiện theo thứ tự thời gian; bên cạnh đó là một chiếc "xe đẩy" dữ liệu gốc, được sử dụng để lưu trữ tài liệu nguồn.

Bạn có thể hình dung nó như một phiên bản cá nhân của Wikipedia. Mỗi trang đều được một trí tuệ nhân tạo liên tục cập nhật, và trí tuệ nhân tạo đó đã tham gia cuộc họp, đọc email, xem diễn thuyết, và tiêu hoá PDF.

Dưới đây là một ví dụ có thể minh họa cách hệ thống này tăng cường dần.

Tôi gặp một nhà sáng lập trong giờ làm việc cá nhân. Hệ thống sẽ tạo hoặc cập nhật trang cá nhân của anh ta, trang công ty, tạo liên kết với ghi chú cuộc họp, kiểm tra xem trước đây tôi đã gặp anh ta chưa - nếu có, sẽ hiển thị phần trò chuyện lần trước chúng tôi nói chuyện điều gì; nó sẽ kiểm tra thông tin đăng ký của anh ta, trích dẫn số liệu mới nhất, và xác định liệu có ai trong danh mục đầu tư của tôi hoặc liên hệ có thể giúp được anh ta với vấn đề anh ta đang xử lý.

Cho đến khi tôi bước vào cuộc họp tiếp theo với anh ta, hệ thống đã sẵn sàng với một bộ ngữ cảnh hoàn chỉnh.

Đây chính là sự khác biệt giữa "tủ tài liệu" và "hệ thống thần kinh". Tủ tài liệu chỉ lưu trữ mọi thứ; hệ thống thần kinh sẽ kết nối chúng, đánh dấu những thay đổi đã xảy ra, và hiển thị thông tin liên quan nhất trong lúc đó.

Kiến trúc

Cách thức hoạt động của nó như sau. Tôi nghĩ rằng đây là con đường đúng để xây dựng trí tuệ nhân tạo cá nhân, vì vậy tôi đã phát hành toàn bộ mã nguồn mở, bạn cũng có thể tự xây dựng.

Harness rất mỏng. OpenClaw là thời gian chạy. Nó nhận thông điệp của tôi, xác định kỹ năng nào thích hợp, sau đó phân phối. Chỉ vài nghìn dòng logic định tuyến. Nó không hiểu về sách, cuộc họp hay người sáng lập, nó chỉ đảm nhận việc định tuyến.

Kỹ năng rất dày. Hiện tại đã có hơn 100 kỹ năng, mỗi kỹ năng là một tập tin markdown độc lập chứa hướng dẫn chi tiết về một nhiệm vụ cụ thể. Bạn đã thấy book-mirror và meeting-prep ở phía trước. Dưới đây là một số kỹ năng khác mà GBrain tích hợp sẵn:

meeting-ingestion: Sau mỗi cuộc họp, nó sẽ tải bản tóm tắt, tạo ra một bản tóm tắt có cấu trúc, sau đó duyệt qua mỗi người và mỗi công ty được đề cập trong cuộc họp, cập nhật trang brain của họ bằng nội dung thảo luận. Trang cuộc họp không phải là sản phẩm cuối cùng, giá trị thực sự là việc truyền dẫn thông tin này trở lại trang của mỗi người và mỗi công ty.

enrich: Cung cấp tên của một người. Nó sẽ tải thông tin từ năm nguồn khác nhau, hợp nhất tất cả thành một trang brain, bao gồm sự nghiệp, thông tin liên hệ, lịch sử cuộc họp và ngữ cảnh mối quan hệ. Mỗi sự đánh giá đều có tham chiếu nguồn.

media-ingest: Xử lý video, âm thanh, PDF, ảnh chụp màn hình và GitHub repo. Nó sẽ tạo chữ viết thành văn bản, trích xuất thực thể, và lưu trữ tài liệu vào vị trí brain đúng. Tôi thường sử dụng nó để xử lý video YouTube, podcast và ghi chú giọng nói.

perplexity-research: Đây là nghiên cứu mạng có khả năng tăng cường bằng brain. Nó tìm kiếm trang web dựa trên Perplexity, nhưng trước khi tổng hợp, nó sẽ kiểm tra xem những gì đã được biết trong brain, từ đó cho biết thông tin nào thực sự mới, thông tin nào đã được ghi nhận.

Tôi đã xây dựng một số kỹ năng cho công việc của mình, và có khả năng sẽ phát hành mã nguồn mở sau này: email-triage, investor-update-ingest—anagak nó có thể nhận dạng cập nhật trong danh mục đầu tư trong hộp thư đến của tôi, và cập nhật các chỉ số vào trang của công ty; calendar-check—dùng để kiểm tra xung đột lịch trình và sắp xếp di chuyển không thể; cũng như một bộ công cụ nghiên cứu tin tức mới mà tôi sử dụng cho công việc công cộng.

Mỗi kỹ năng mã nguồn có kiến thức vận hành, và những kiến thức này, nếu được giao cho một trợ lý con người mới, có thể cần vài tháng để học. Một số người hỏi tôi làm thế nào để "khuyến nghị" cho AI của mình. Câu trả lời là: tôi không khuyến nghị. Chính kỹ năng là lời khuyên.

Dữ liệu rất phong phú. Trong kho tư duy của tôi có 100,000 trang kiến thức đã được cấu trúc. Mọi người, mỗi công ty, mỗi cuộc họp, mỗi cuốn sách, mỗi bài báo, mỗi ý tưởng mà tôi đã tiếp xúc đều được kết nối và có thể tìm kiếm, và mỗi ngày đều còn ngày càng phát triển.

Mã cũng rất phong phú. Mã cung cấp cho nó cũng rất quan trọng: mã nguồn, OCR, lưu trữ mạng xã hội, đồng bộ hóa lịch, các kịch bản tích hợp API. Nhưng nơi giá trị lãi kép thực sự chất lượng, đó là dữ liệu.

Mỗi ngày tôi chạy hơn 100 nhiệm vụ cron, kiểm tra mọi thứ tôi quan tâm: mạng xã hội, Slack, email, và bất kỳ thông tin nào khác mà tôi muốn lưu ý. Các Agent OpenClaw/Hermes của tôi cũng sẽ xem xét những thứ này thay tôi.

Mô hình có thể thay thế. Để đạt được tính chính xác, tôi sử dụng Opus 4.7 1M; Để đạt được khả năng gợi và trích xuất toàn diện, tôi sử dụng GPT-5.5; Để làm việc sáng tạo và từ góc nhìn thứ ba, tôi sử dụng DeepSeek V4-Pro; Để tăng tốc, tôi sử dụng Groq và Llama. Kỹ năng quyết định mô hình nào phù hợp với công việc nào. Harness không quan tâm.

Khi có ai đó hỏi "mô hình AI nào tốt nhất," câu trả lời là: bạn đã hỏi sai câu hỏi. Mô hình chỉ là động cơ, mọi phần còn lại mới là chiếc xe hoàn chỉnh.

Builder vào lúc 2 giờ sáng, và một hệ thống cộng gộp không ngừng

Mọi người hỏi tôi về mặt sản xuất. Nhưng tôi không nghĩ về mặt đó.

Tôi nghĩ về việc cộng gộp.

Mỗi cuộc họp mà tôi tham gia đều hỗ trợ việc mở rộng tư duy này. Mỗi cuốn sách tôi đọc đều phong phú kiến thức cho cuốn sách tiếp theo. Mỗi kỹ năng tôi xây dựng đều giúp tăng tốc quy trình làm việc tiếp theo. Mỗi trang cá nhân tôi cập nhật giúp chuẩn bị cuộc họp tiếp theo sắc sảo hơn.

Hệ thống hôm nay đã phát triển lên gấp đôi so với hai tháng trước. Hai tháng nữa, nó sẽ phát triển lên gấp đôi so với hiện tại.

Khi tôi viết mã vào lúc 2 giờ sáng – và thực sự tôi thường làm như vậy, vì AI đã mang lại niềm vui của việc xây dựng cho tôi lại – tôi không chỉ đơn thuần viết phần mềm. Tôi đang tăng cường khả năng của một hệ thống liên tục hoàn thiện vào mỗi giờ.

100 công việc cron chạy suốt ngày. Việc tiếp nhận cuộc họp tự động thực hiện. Phân loại email chạy mỗi 10 phút. Bản đồ tri thức tự bổ sung từ mỗi cuộc trò chuyện. Hệ thống cập nhật các bản ghi chép hàng ngày và trích xuất các mẫu mà tôi chưa lưu ý ngay lập tức.

Đây không phải là một công cụ viết văn, không phải là công cụ tìm kiếm, cũng không phải là trò chuyện với chatbot.

Đây là một bộ não thứ hai thực sự có thể chạy. Đó không phải là một phép ẩn dụ, mà là một hệ thống đang hoạt động: 100.000 trang nội dung, hơn 100 kỹ năng, 15 công việc định kỳ, cùng với ngữ cảnh tích lũy từ mỗi mối quan hệ nghề nghiệp, mỗi cuộc họp, mỗi cuốn sách và mỗi ý tưởng mà tôi đã tham gia trong năm qua.

Tôi đã phát hành toàn bộ ngăn xếp công nghệ của mình cho cộng đồng mã nguồn mở. GStack là một khung kỹ năng lập trình, đã có hơn 87.000 sao trên GitHub, tôi đã sử dụng nó để xây dựng hệ thống này. Khi agent cần viết mã, tôi vẫn sẽ sử dụng nó như một kỹ năng trong OpenClaw/Hermes Agent. Nó cũng đi kèm với một trình duyệt có thể lập trình tuyệt vời, hỗ trợ cả chế độ có đầu và không đầu.

GBrain là cơ sở hạ tầng tri thức. OpenClaw và Hermes Agent là bộ đồng bộ, bạn có thể chọn một trong hai, nhưng tôi thường sử dụng cả hai. Cả hai kho dữ liệu đều trên GitHub.

Quyết định cốt lõi rất đơn giản: Tương lai thuộc về những cá nhân có khả năng xây dựng các hệ thống AI phức hợp, chứ không phải những cá nhân chỉ biết sử dụng các công cụ AI tập trung doanh nghiệp sở hữu.

Sự khác biệt giữa hai điều này giống như sự khác biệt giữa việc viết nhật ký và sở hữu một hệ thống thần kinh.

Làm thế nào để bắt đầu

Nếu bạn cũng muốn xây dựng một hệ thống như vậy:

Đầu tiên, chọn một bộ đồng bộ. Bạn có thể sử dụng OpenClaw, Hermes Agent, hoặc xây dựng từ đầu dựa trên Pi. Quan trọng là giữ cho nhẹ nhàng. Bộ đồng bộ chỉ là bộ định tuyến. Bạn có thể triển khai nó trên máy tính tồn đọng tại nhà, truy cập thông qua Tailscale; hoặc đặt nó trên dịch vụ đám mây như Render hoặc Railway.

Sau đó, sử dụng GBrain để xây dựng một "bộ não". Ban đầu tôi được truyền cảm hứng từ LLM Wiki của Karpathy, sau đó đã triển khai nó trong OpenClaw, sau đó mở rộng thành GBrain. Đó là hệ thống truy xuất tốt nhất mà tôi đã thử nghiệm: đạt được 97,6% tỷ lệ tái tìm trong LongMemEval, vượt qua MemPalace trong giai đoạn truy xuất mà không cần gọi LLM. Nó đi kèm với 39 kỹ năng có thể cài đặt, bao gồm tất cả nội dung được đề cập trong bài viết này. Chỉ cần một lệnh để cài đặt. Bạn sẽ nhận được một kho dữ liệu git, trong đó mỗi người, mỗi cuộc họp, mỗi bài báo, mỗi ý tưởng đều có trang riêng.

Tiếp theo, hãy làm một việc thực sự thú vị. Đừng lên kế hoạch cho cấu trúc kỹ năng của bạn ngay từ đầu. Hãy bắt đầu bằng việc hoàn thành một nhiệm vụ cụ thể: viết một bản báo cáo, nghiên cứu một người, tải xuống kết quả trận đấu NBA của một mùa và xây dựng mô hình dự đoán cho cược thể thao của bạn, phân tích danh mục đầu tư của bạn, hoặc làm bất kỳ điều gì mà bạn thực sự quan tâm. Sử dụng agent của bạn để thực hiện, duy trì quá trình lặp đi lặp lại cho đến khi kết quả đủ tốt, sau đó chạy Skillify—đó chính là meta kỹ năng được đề cập ở trên—rút trích mẫu thuật toán từ đó thành một kỹ năng có thể tái sử dụng. Tiếp tục chạy check_resolvable để xác nhận rằng kỹ năng mới này đã được kết nối vào resolver. Vòng lặp này sẽ biến công việc một lần thành cơ sở hạ tầng có thể tạo ra lợi nhuận kép.

Tiếp tục sử dụng nó và xem xét kết quả một cách nghiêm túc. Kỹ năng này ban đầu chắc chắn sẽ rất bình thường. Đây mới chính là điểm chính. Sử dụng nó, đọc nội dung mà nó tạo ra, khi bạn phát hiện điểm nào đó không đúng, hãy chạy cross-modal eval: đưa ra kết quả cho nhiều mô hình, để chúng đánh giá lẫn nhau dựa trên các chiều bạn quan tâm. Đó chính là cách tôi phát hiện lỗi về sự thật trong book-mirror ban đầu. Tôi sửa lỗi đã được viết vào kỹ năng, từ đó, mỗi lần mirror đều trở nên sạch sẽ hơn.

Sau sáu tháng, bạn sẽ có một thứ mà bất kỳ trò chuyện trả lời tự động nào cũng không thể sao chép. Bởi vì giá trị thực sự không nằm ở mô hình chính nó, mà nằm ở việc bạn đã dạy hệ thống này hiểu biết về cuộc sống cụ thể, công việc và cách suy luận của bạn.

Điều đầu tiên tôi tạo ra bằng hệ thống này rất tệ. Đến lần thứ một trăm, nó đã trở thành một hệ thống tôi dám gửi lịch, hộp thư đến, chuẩn bị cuộc họp và danh sách đọc của tôi. Hệ thống đang học, và tôi cũng đang học. Đường cong gợi nhớ thực sự tồn tại.

Kỹ năng dày, mã nguồn dày, bộ nạp (harness) mỏng. LLM chính là một loại động cơ. Ý bạn hoàn toàn có thể tạo ra chiếc xe của riêng mình.

Tất cả những điều tôi mô tả ở đây—tất cả các kỹ năng, quy trình xây dựng book mirror, khung cross-modal eval, vòng lặp skillify, kiến trúc resolver, và hơn 30 bộ kỹ năng có sẵn để cài đặt—đều đã được công bố công khai và miễn phí trên GitHub.

Hãy xây dựng điều đó.

[Liên kết gốc]

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

#Bộ kết hợp Y #trí tuệ nhân tạo

Báo lỗi/Báo cáo