BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Matt Van: Tất cả các mẹo kỹ thuật Agent mà tôi biết

Đọc bài viết này mất 61 phút

Cách xây dựng quy trình làm việc AI với Claude Code, Codex và plan.md

Tiêu đề gốc: Mọi thủ thuật Kỹ thuật Agentic mà tôi biết (Tháng 6 năm 2026)
Tác giả gốc: Matt Van Horn
Biên dịch: Peggy

Lời biên tập: Đây là bài tổng kết quy trình làm việc cá nhân về Kỹ thuật Agentic (Agentic Engineering). Tác giả Matt Van Horn ghi lại không phải mẹo sử dụng một công cụ lập trình AI cụ thể nào, mà là một bộ phương pháp hoàn chỉnh để tái cấu trúc quy trình sản xuất xoay quanh AI Agent.

Trong thực tiễn của anh ấy, AI không còn chỉ là trợ lý hoàn thiện mã trong IDE, mà giống như một "đội ngũ thực thi" có thể được điều phối: đầu tiên dùng /ce-plan để tổ chức ý tưởng mơ hồ thành plan.md, sau đó dùng /ce-work để thực thi; dùng giọng nói thay vì gõ phím; đồng thời mở nhiều phiên cmux, Claude, Codex song song để tiến triển; để Claude đảm nhận lập kế hoạch và phán đoán, để Codex đảm nhận xây dựng; biến bản ghi cuộc họp, ghi chú, giải pháp lịch sử và kho mã thành ngữ cảnh của Agent; sau đó kết tinh các hành động tần suất cao thành các skills có thể tái sử dụng.

Sự thay đổi đằng sau bộ phương pháp này nằm ở chỗ, giá trị cốt lõi của nhà phát triển đang chuyển từ "tự tay hoàn thành từng dòng mã" sang "đặt câu hỏi, thiết lập ràng buộc, định hướng phán đoán, liên tục hiệu chỉnh". Khi Agent có thể đảm nhận phần lớn công việc thực thi, con người giống như nguồn tín hiệu trong hệ thống: cung cấp gu thẩm mỹ, kinh nghiệm, ưu tiên và phán đoán cuối cùng.

Do đó, điều thực sự đáng chú ý trong bài viết này không phải là một plugin hay lệnh cụ thể nào, mà là sự thay đổi trong quan hệ sản xuất khi công cụ AI trưởng thành. Sau khi chi phí thực thi giảm xuống, cá nhân có thể đồng thời tiến triển nhiều dự án hơn, nhưng cũng dễ rơi vào vòng lặp liên tục xây dựng và phát hành. Tác giả nhắc nhở độc giả ở cuối bài: có thể tạo ra thứ gì đó, không có nghĩa là có người cần nó. Đối với những người đang dùng AI để viết mã, làm sản phẩm, viết nội dung hoặc quản lý công việc tri thức, bài viết này đặt ra một câu hỏi thực tế hơn: Khi "bắt tay vào làm" ngày càng rẻ, chúng ta nên định nghĩa lại giá trị của mình như thế nào?

Dưới đây là nội dung gốc:

Ba tháng trước, tôi đã đăng bài "Mọi thủ thuật Claude Code mà tôi biết". Bài viết đó có 913.000 lượt xem. @kevinrose lúc đó hỏi nên dùng IDE nào, câu trả lời của tôi là: "Không cần IDE. Chỉ cần file plan.md và giọng nói."

Trước đây, điều này được gọi là vibe coding. Khoảng từ Lễ Tạ ơn năm ngoái trở đi, khả năng của mô hình cuối cùng đã đủ tốt để biến "món đồ chơi" này thành thứ có thể sử dụng thực sự, tức là thứ mà nhiều người gọi là Kỹ thuật Agentic (Agentic Engineering). Đây cũng là lý do duy nhất tôi có thể duy trì giao hàng liên tục trong năm nay. Năm nay, tôi đã phát hành last30days (27.000 Star), Printing Press (4000+ Star) và Agent Cookie vừa ra mắt; đồng thời, tôi cũng trở thành người đóng góp quan trọng cho một số dự án mã nguồn mở lớn, bao gồm Python, Go, GStack và Paperclip. Kể từ sau thời trung học, tôi chưa từng tạo ra phần mềm nào thực sự có người quan tâm. Dưới đây là tất cả thủ thuật của tôi.

Mẹo

Mẹo đọc nhanh kiểu YOLO: Copy toàn bộ bài viết cho agent của bạn, bảo nó lập một kế hoạch, cấu hình tất cả những thứ được đề cập ở đây, rồi thực hiện từng mẹo một. Đó là toàn bộ stack làm việc của tôi, thậm chí bạn không cần tự đọc hết.

1. Có ý tưởng là làm ngay một CE plan.md

Đây vẫn là nguyên tắc đầu tiên. Cũng là điều quan trọng nhất tôi học được.

Chỉ cần tôi có một ý tưởng, việc đầu tiên tôi làm là dùng /ce-plan để tạo một plan.md. Không phải "để tôi nghĩ trước", cũng không phải "để tôi bắt đầu viết code". Mỗi lần, đều là /ce-plan. Nó cũng hỗ trợ hình ảnh, vì vậy bất cứ thứ gì bạn chụp được đều có thể làm điểm khởi đầu:

· Ý tưởng sản phẩm điên rồ: /ce-plan.
· Bug trên GitHub: Copy URL issue, dán vào, /ce-plan.
· Lỗi terminal: Cmd+Shift+4 chụp màn hình, Ctrl+V dán, /ce-plan fix this.
· Ảnh chụp màn hình, thông báo lỗi, bản thiết kế, chuỗi thảo luận Slack: đều có thể ném thẳng vào.

Nếu ý tưởng còn mơ hồ, thậm chí tôi không biết mình thực sự muốn gì, tôi sẽ dùng /ce-brainstorm để cùng agent làm rõ vấn đề, đợi đến khi phác thảo rõ ràng rồi mới dùng /ce-plan.

Ở tầng nền, /ce-plan sẽ song song triển khai nhiều agent nghiên cứu. Một agent đọc codebase của bạn, tìm kiếm pattern, kiểm tra quy ước code của bạn; một agent khác tìm kiếm các giải pháp trước đây của bạn, rút ra kinh nghiệm từ đó. Nếu chủ đề này đáng để đào sâu, nó sẽ cử thêm agent nghiên cứu tài liệu bên ngoài và best practices. Tất cả diễn ra đồng thời. Sau đó, nó tổng hợp kết quả và viết ra một plan.md có cấu trúc: vấn đề ở đâu, hướng giải quyết là gì, cần sửa những file nào, tiêu chí chấp nhận kèm checkbox, những pattern nào trong code của bạn nên được giữ lại. Nó không phải lời khuyên chung chung, mà là giải pháp dựa trên repo, quy ước và lịch sử kinh nghiệm của bạn.

/ce-work sẽ dùng kế hoạch này để xây dựng. Context bị quá tải? Mở một session mới, trỏ nó vào plan này, và tiếp tục từ chỗ bạn dừng lại. Kế hoạch này chính là checkpoint vượt qua mọi mất mát context.

Phát triển truyền thống là 80% coding, 20% lập kế hoạch. Ở đây thì ngược lại: suy nghĩ đều được đưa vào kế hoạch, thực thi trở thành hành động máy móc.

Compound Engineering là plugin do @kieranklaassen và @trevin tạo ra, giúp quy trình này thực sự vận hành trơn tru.

Ban đầu tôi chỉ là một fan cuồng, sau đó trở thành người đóng góp, và giờ đây là người đóng góp lớn thứ ba bên ngoài đội ngũ cốt lõi. Nguyên tắc của tôi rất đơn giản: trừ khi chỉ sửa một dòng code, nếu không thì nhất định phải có một file plan.md trước.

Mẹo

Cài đặt Compound Engineering:

/plugin marketplace add EveryInc/compound-engineering-plugin

Dán ảnh chụp màn hình, URL lỗi hoặc thông báo lỗi, sau đó /ce-plan, rồi /ce-work.
Ý tưởng chưa rõ ràng? Hãy dùng /ce-brainstorm trước.

2、Đừng đọc plan.md

Tôi luôn tạo plan.md. Nhưng tôi hầu như không bao giờ đọc nó. Kế hoạch là dành cho agent, còn bạn, con người ngốc nghếch kia, đừng đọc.

Buộc phải tạo một kế hoạch sẽ ngăn agent lười biếng. Nó phải nghiên cứu, phải cam kết một phương pháp, phải viết tiêu chí chấp nhận, và sau đó thực sự hoàn thành các tiêu chí đó. Một coding agent có kế hoạch sẽ bàn giao công việc hoàn chỉnh; một coding agent không có kế hoạch sẽ đi đường tắt và dừng lại quá sớm. Kế hoạch chính là sợi dây trói buộc nó.

Vì vậy, tôi để nó viết kế hoạch, lướt qua tiêu đề, rồi chạy thẳng /ce-work. Nếu có thắc mắc, tôi hỏi trực tiếp trong cùng session: "Khoan, tại sao lại dùng cách này?" hoặc yêu cầu nó đưa ra TLDR. Hoặc khi tôi hoàn toàn không hiểu, tôi nói: "eli5 this plan" (giải thích kế hoạch này như cho trẻ 5 tuổi). Tôi nhận được một đoạn ngắn, gật đầu, và tiếp tục. Tôi sẽ không ngồi đọc 300 dòng markdown. Đó là bài tập của agent, không phải của tôi.

Tạo kế hoạch. Tin tưởng kế hoạch. Đừng đọc kế hoạch.

Mẹo

Đừng bắt bản thân đọc kế hoạch. Hãy hỏi trực tiếp trong session: TLDR?, eli5 this plan, hoặc "Khoan, tại sao lại dùng cách này?"

3、Dùng /ce-plan cho những công việc phi kỹ thuật sâu nhất: Lập kế hoạch cho "kế hoạch" trước

Nhiều người nghĩ rằng /ce-plan và /ce-work chỉ dùng để viết code. Nhưng bài học lớn nhất tôi học được từ tháng Ba là: chúng không chỉ dành cho code. Giờ đây, những công việc tri thức chuyên sâu nhất tôi làm cũng đều chạy trong cùng một vòng lặp đó. Bí quyết chính là: kế hoạch đầu tiên không phải để giải quyết vấn đề trực tiếp, mà là để lập ra một kế hoạch về "cách lập kế hoạch". Đây không phải là tôi cố gắng dùng một công cụ code cho mục đích khác; /ce-plan vốn đã tích hợp sẵn các mẫu lập kế hoạch tổng quát, được thiết kế chính xác cho những công việc không phải code này.

Điều này không chỉ áp dụng cho các vấn đề kinh doanh. Tài liệu chiến lược, thông số sản phẩm, phân tích đối thủ cạnh tranh, cập nhật hội đồng quản trị – tất cả đều có thể dùng cùng một vòng lặp.

Lấy một ví dụ thực tế. Lúc đó tôi đang ấp ủ một thử thách kinh doanh và đã gặp Michael Margolis. Anh ấy từng là cộng tác viên nghiên cứu tại GV, nổi tiếng với phương pháp bullseye-customer method (phương pháp khách hàng mục tiêu). Anh ấy đề nghị tôi đọc cuốn sách của mình, có thể tải PDF miễn phí trên trang web của anh ấy. Cách cũ là tôi sẽ đọc lướt qua rồi bỏ qua. Nhưng lần này, tôi mở Claude Code và nói đại khái như thế này:

/ce-plan make a plan for the plan. Tôi sẽ đưa cho bạn hai thứ: cuốn sách của Margolis, định dạng PDF; và bản ghi chép cuộc họp Granola kéo dài hai tiếng tôi vừa có với anh ấy, chứa đầy đủ ngữ cảnh cuộc thảo luận của chúng tôi. Tôi muốn bạn lập một kế hoạch thấu đáo về cách kết hợp vấn đề kinh doanh của tôi, cuộc trò chuyện này và kinh nghiệm từ cuốn sách để tạo ra thứ gì đó tôi thực sự có thể sử dụng. Đừng viết tài liệu đó ngay bây giờ. Viết tài liệu đó mới là công việc chính. Bây giờ tôi chỉ muốn bạn lập kế hoạch về cách bạn sẽ đọc cuốn sách, khai thác bản ghi cuộc họp và tạo ra một tài liệu chất lượng cao.

Trong 45 phút tiếp theo, nó đã tạo ra một kế hoạch rất hoành tráng.

Đây cũng là mẹo hay nhất tôi biết để ngăn LLM làm việc lười biếng. Nếu bạn yêu cầu nó giao sản phẩm ngay lập tức, nó thường sẽ đi đường tắt; nhưng nếu bạn yêu cầu nó lập kế hoạch "cách tạo ra sản phẩm đó" trước, rồi thực hiện kế hoạch đó, nó sẽ luôn tạo ra một phiên bản sâu sắc hơn.

Mẹo

Công việc phi code chuyên sâu: Dùng /ce-plan make a plan for the plan, cung cấp tất cả ngữ cảnh và bản ghi cuộc họp cho nó, sau đó mới /ce-work.

4、Chấp nhận đầu vào bằng giọng nói

Sử dụng đầu vào bằng giọng nói với LLM khác hoàn toàn so với bất kỳ thứ gì khác. Bản ghi chép không cần phải hoàn hảo, vì thứ nghe bạn nói hiểu được ngữ cảnh. Nó sẽ đoán ra những gì micro nghe nhầm. Bạn có thể nói lắp, ngập ngừng, nói một nửa rồi bắt đầu lại. Giọng nói cuối cùng cũng có thể sử dụng được, bởi vì đầu kia đủ thông minh để lấp đầy những khoảng trống.

Cấu hình của tôi là:

· Mac: Dùng Monologue (do Every làm) hoặc Wispr Flow. Chọn một trong hai, nhập giọng nói vào ứng dụng đang tập trung, sau đó nói trực tiếp với Claude Code. Tôi cũng đã mua một micro cổ ngỗng cho văn phòng.

· Điện thoại: Không dùng Monologue và Wispr Flow, vì chuyển qua lại trên iOS quá phiền phức. Tính năng đọc chính tả tích hợp sẵn của Apple đã đủ dùng, vì bạn đang nói chuyện với LLM, không phải với con người. Dù nó chuyển sai một nửa số từ, agent vẫn hiểu được. Ghi chú lười biếng cũng hoàn toàn ổn.

· Thành thật mà nói: Tôi rất giỏi dùng giọng nói khi ở một mình. Nhưng trong văn phòng, tôi khó mà dùng được. Có người nói bạn có thể nói nhỏ vào micro, nhưng tôi nhận ra mình thực sự không làm vậy, vì tôi không muốn tỏ ra bất lịch sự và cũng không muốn làm phiền người xung quanh. Vì vậy, bối cảnh bàn làm việc trong văn phòng chung vẫn là điểm yếu của quy trình làm việc này. Nếu bạn đã giải quyết được vấn đề nhập liệu bằng giọng nói trong văn phòng mở mà không trở thành "kiểu người đó", hãy cho tôi biết cách làm. Tôi thực sự muốn nghe lời khuyên.

Mẹo

· Mac: Cài đặt Monologue hoặc Wispr Flow.

· Điện thoại: Dùng tính năng đọc chính tả tích hợp sẵn của Apple.

· Mua thêm một micro cổ ngỗng.

5, Mở rất nhiều tab trong cmux

Đây là một ngày thực tế của tôi. Bốn đến sáu tab cmux, đôi khi nhiều hơn, mỗi tab là một session độc lập:

· Một tab đang viết kế hoạch.

· Một tab đang xây dựng dựa trên một kế hoạch khác.

· Một tab đang chạy last30days.

· Một tab đang sửa lỗi tôi phát hiện khi kiểm tra một thứ trước đó.

Khi /ce-plan bắt đầu nghiên cứu trong một cửa sổ, tôi chuyển sang cửa sổ khác, chạy /ce-work trên một kế hoạch đã viết sẵn. Khi nó đang xây dựng, cửa sổ thứ ba lại có thể dán vào một lỗi mới. Đến khi tôi quay lại cửa sổ đầu tiên, nó đã hoàn thành và chờ sẵn.

Tôi nghe nói Orca làm việc rất tốt trên di động. Trước đây tôi cũng là người thuần túy dùng Ghostty, nhưng tôi đã bỏ lỡ quá nhiều thông báo trong Ghostty.

Mẹo

Sử dụng cmux.

Giữ 4 đến 6 tab đang mở, mỗi tab xử lý một tác vụ khác nhau.

6. Đặt terminal mặc định mở Claude hoặc Codex thay vì Shell

Một tab mới nên mở trực tiếp Claude Code thay vì shell. Khi mở tab, bạn đã có thể trò chuyện với agent. Không cần cd, không cần nhập claude. Khi chỉ cần một lần nhấn phím để mở session mới, bạn sẽ khởi động chúng thường xuyên hơn. Tôi cũng không sử dụng thư mục. Agent của bạn sẽ tự tìm thấy dự án.

Mẹo

Dán đoạn văn bản này cho agent của bạn:

Đặt mọi tab terminal mới mở trực tiếp Claude Code. Thêm dòng này vào ~/.config/ghostty/config: command = ~/.local/bin/claude-launcher.sh, không làm hỏng bất kỳ cài đặt nào khác đã có trong tệp này. Sau đó tạo ~/.local/bin/claude-launcher.sh, chạy lệnh claude --dangerously-skip-permissions, và sau khi Claude thoát, in một đoạn gợi ý ngắn, rồi vào một interactive login zsh. Thực hiện chmod +x cho script này. Điều này hoạt động cho cả Ghostty và cmux, vì cmux đọc cùng một cấu hình Ghostty.

7. Điều khiển từ xa mọi cửa sổ và cấp cho Claude Code hoặc Codex một địa chỉ email

Hai mẹo này giúp mỗi session có thể truy cập từ bất kỳ đâu.

Mỗi khi mở cửa sổ mới, hãy bật điều khiển từ xa.
Đặt điều khiển từ xa tự động bật cho mỗi session.

Giờ đây, mọi cửa sổ đều có thể truy cập từ ứng dụng Claude trên điện thoại. Bạn khởi động một session tại bàn làm việc, rồi rời đi, và tiếp tục điều khiển cùng một tác vụ đang chạy thời gian thực trên điện thoại. Khi xếp hàng, bạn cũng có thể điều khiển những gì đang chạy trên Mac ở nhà.

Cấp cho Claude một địa chỉ email.
Thông qua AgentMail, Claude Code có thể có một địa chỉ email. Đây là điều mà người sáng lập Adi @adisingh đã dạy tôi. Bạn gửi email đến inbox đó, một session mới sẽ mở ra và bắt đầu xử lý nội dung trong tiêu đề và thân email, tất cả tệp đính kèm cũng có sẵn dưới dạng đường dẫn. Phát hiện lỗi trong bữa tối? Gửi email từ điện thoại, khi bạn quay lại màn hình, session đã chạy rồi. Tôi đã mã nguồn mở toàn bộ: github.com/mvanhorn/agentmail-to-claude-code.

Nó bao gồm ba phần:

Một daemon, lắng nghe hộp thư AgentMail qua WebSocket. Mỗi khi nhận được một email từ danh sách trắng, nó sẽ mở một phiên Claude mới, ghi email vào file prompt và yêu cầu Claude đọc và thực thi.

Hai backend terminal: cmux hoặc Ghostty độc lập, để nó có thể điều khiển cách khởi động mà bạn vốn đang sử dụng.

Một đầu gửi. Tôi đã kết nối nó vào lệnh cc trong Hermes, vì vậy tôi có thể chạy cc <task> trên điện thoại, và tác vụ sẽ rơi vào một phiên làm việc trên Mac của tôi, không cần VPN, cũng không cần SSH.

Danh sách trắng chính là cánh cổng. Chỉ các địa chỉ bạn kiểm soát mới có thể vượt qua; bất kỳ email nào thất bại kiểm tra DKIM hoặc SPF sẽ bị loại bỏ trước khi phiên được mở.

Mẹo

Luôn bật điều khiển từ xa: Thêm vào ~/.claude/settings.json:

"remoteControlAtStartup": true

Cấp cho Claude một địa chỉ email. Dán đoạn văn này cho agent của bạn:

Sử dụng github.com/mvanhorn/agentmail-to-claude-code để cấp cho Claude Code một địa chỉ email. Clone nó, thiết lập một hộp thư AgentMail, điền vào cc.env với API key, hộp thư, danh sách trắng chỉ chứa địa chỉ email của tôi và loại terminal của tôi (cmux hoặc Ghostty), sau đó chạy daemon và cài đặt nó như một tác vụ launchd. Khi tôi gửi email đến hộp thư đó, một phiên Claude Code mới sẽ mở trên Mac này và bắt đầu xử lý tiêu đề cùng nội dung email.

8. Mạo hiểm bỏ qua xác nhận quyền. Vâng, tôi nghiêm túc đấy

Claude Code yêu cầu quyền mỗi khi chỉnh sửa và thực thi lệnh. Khi bạn chạy sáu phiên cùng lúc, bạn không thể lúc nào cũng theo dõi nó. Có hai cài đặt giúp việc này trở nên khả thi. Có người nói chế độ tự động là cách làm "an toàn hơn", nhưng với tôi nó quá chậm.

Điểm mấu chốt là:

skipDangerousModePermissionPrompt: true

Nếu không có nó, Claude sẽ yêu cầu bạn xác nhận mỗi phiên làm việc. Bạn cũng có thể dùng Shift+Tab để chuyển đổi. Có người nói với tôi rằng chế độ "auto" mới có thể đạt được hầu hết hiệu quả trong điều kiện an toàn hơn. Có thể thôi. Quan điểm của tôi là YOLO. Đây là máy tính của tôi. Nếu tôi làm hỏng mọi thứ, GitHub vẫn còn đó. Khi tôi giúp bạn cấu hình Claude Code, AI còn chủ động cố gắng khuyên anh ấy không nên bật cài đặt này. Bạn phải trực tiếp một chút.

Một cài đặt khác là hook âm thanh. Khi chạy song song sáu phiên, điều này là bắt buộc.

Bạn có thể rời đi, nghe thấy âm thanh rồi quay lại. Khi sáu phiên chạy đồng thời, âm thanh chính là cách bạn biết tác vụ nào vừa hoàn thành.

Mẹo

Dán vào ~/.claude/settings.json:

{
"permissions": {
"allow": [
"WebSearch",
"WebFetch",
"Bash",
"Read",
"Write",
"Edit",
"Glob",
"Grep",
"Task",
"TodoWrite"
],
"deny": [],
"defaultMode": "bypassPermissions"
},
"skipDangerousModePermissionPrompt": true
}

{
"hooks": {
"Stop": [
{
"hooks": [
{
"type": "command",
"command": "afplay /System/Library/Sounds/Blow.aiff"
}
]
}
]
}
}

Codex cũng có chế độ YOLO tương tự. Trong tệp ~/.codex/config.toml:

approval_policy = "never"
sandbox_mode = "danger-full-access"

Hoặc khi khởi động một lần, sử dụng:

codex --yolo

9. Làm thế nào để hầu như không mở Codex CLI nhưng vẫn để Codex xử lý phần lớn code

Tôi giao việc cho Codex suốt cả ngày, nhưng hầu như không bao giờ mở Codex CLI. Claude lập kế hoạch, Codex xây dựng, còn tôi luôn ở lại trong phiên làm việc của Claude.

Tôi có ba cách để giao việc cho Codex mà không cần rời khỏi Claude:

· Codex IDE Extension: Gửi một tác vụ, áp dụng kết quả, không cần vào terminal của Codex.
· /ce-work --codex: Ủy thác việc xây dựng trực tiếp cho Codex trong vòng lặp Compound Engineering.
· Chế độ Codex của Printing Press: Thêm codex vào cuối prompt khi tạo CLI mới, nó sẽ chuyển việc xây dựng cho Codex.

Thiết lập của tôi là cả hai engine đều bật extra-high reasoning:

Codex: reasoning xhigh, fast mode luôn bật.

Claude Code: reasoning xhigh, fast mode tắt. Fast mode của nó tính phí theo token ngoài gói Max 200 đô la của bạn, nên tôi không dùng.

Hai gói đăng ký 200 đô la chạy song song, tương đương với có thêm cả một engine thứ hai. Tôi đẩy các tác vụ xây dựng song song lớn cho Codex, để Claude phụ trách lập kế hoạch và thẩm mỹ. Một số bạn bè làm ngược lại: Codex xây dựng, Claude kiểm tra.

Mẹo

Codex: reasoning xhigh, fast mode bật.

Claude Code: xhigh, fast mode tắt.

Giao công việc cho Codex: Sử dụng tiện ích mở rộng Codex IDE, /ce-work --codex, hoặc thêm "codex" vào cuối lời nhắc Printing Press.

10. Nghiên cứu trước khi lập kế hoạch: last30days

Trước khi chạy /ce-plan, tôi thường chạy /last30days về chủ đề đó trước.

Có lần, tôi phải chọn giữa agent-browser của Vercel và Playwright. Thay vì đọc tài liệu, tôi chạy:

/last30days Vercel agent browser vs Playwright

Vài phút sau, tôi có hàng chục cuộc thảo luận trên Reddit, bài đăng X, video YouTube, câu chuyện HN. agent-browser tiêu tốn ít ngữ cảnh hơn nhiều mỗi lần gọi, trong khi Playwright chỉ riêng định nghĩa công cụ đã đổ ra vài nghìn token. Tôi đưa toàn bộ đầu ra vào /ce-plan integrate agent-browser. Kế hoạch được tạo ra dựa trên những gì cộng đồng thực sự biết vào lúc đó, chứ không phải dữ liệu huấn luyện từ sáu tháng trước.

last30days là một dự án mã nguồn mở, hiện đã có hơn 26.000 Star. Nó tìm kiếm song song Reddit, X, YouTube, TikTok, Instagram, HN, Polymarket, GitHub và toàn bộ web. Tôi chạy nó trước khi chọn thư viện, trước khi làm tính năng, trước khi gặp đối tác kinh doanh, trước khi viết bài. Tôi cũng đã chạy nó trên một vài chủ đề trong bài viết này. Nghiên cứu, lập kế hoạch, xây dựng. Đó mới là vòng lặp thực sự.

Mẹo

Cài đặt last30days.
Trước /ce-plan, hãy chạy:

/last30days <chủ đề>

Nhớ cài đặt khóa ScrapeCreators.

11. Đưa mọi thứ vào Granola và đưa bản ghi chép gốc vào LLM

Tôi đã ăn trưa với một ứng viên. Chúng tôi nói về sản phẩm, đồ ăn, con cái, một cuộc trò chuyện bình thường kéo dài 90 phút với một ý tưởng sản phẩm lồng ghép bên trong. Granola đã ghi âm suốt. Kết thúc, tôi dán toàn bộ bản ghi chép gốc vào Claude Code:

/ce-plan biến nó thành một đề xuất sản phẩm

Điểm mấu chốt là "nguyên bản". Tôi sẽ không tóm tắt trước. Tôi sẽ đưa toàn bộ bản ghi chép lộn xộn vào thẳng, kể cả phần lạc đề về sushi, sau đó để Claude dựa trên kho mã thực tế của tôi và tất cả các kế hoạch chiến lược tôi từng viết để trích xuất thông tin hữu ích. Bối cảnh Granola + kho mã + kế hoạch lịch sử, tạo ra vàng. Nó viết ra một bản đề xuất ngay lập tức, tự động bỏ qua phần trò chuyện nhà hàng, và tôi đã gửi đi ngay trong tối hôm đó. Người đó hiện đã làm việc toàn thời gian với chúng tôi.

Bản nâng cấp từ tháng Ba là: Printing Press Granola CLI. Thứ này thật kỳ diệu. Tôi có thể kéo bất kỳ cuộc họp nào dưới dạng dữ liệu có cấu trúc sạch sẽ trực tiếp vào session, có thể tìm kiếm mọi cuộc họp tôi từng tham gia, tìm lại câu nói của ai đó từ ba tuần trước, rồi nhập nó vào kế hoạch. Không còn sao chép-dán nữa. Bối cảnh của mọi cuộc họp chỉ cách một lệnh.

Mẹo

Đưa bản ghi chép gốc của Granola thẳng vào /ce-plan, đừng tóm tắt trước.
Cài đặt Printing Press Granola CLI.

12. Tín hiệu con người

Đây là sự thay đổi tư duy mất nhiều thời gian nhất để tôi hoàn thành. Khi bạn chạy sáu agent cùng lúc, công việc của bạn không phải là tự mình làm mọi thứ. Công việc của bạn là trở thành tín hiệu.

Agent cung cấp sản lượng. Bạn cung cấp gu thẩm mỹ, định hướng và vòng lặp "phản hồi - điều chỉnh lại". Bạn nhìn vào kết quả nó trả về và nói: "Phương án thứ hai gần hơn, nhưng dùng từ ngữ của phương án thứ nhất", "Xử lý rủi ro lớn nhất", "Đoạn này dài quá", và chúng sẽ di chuyển. Thứ khan hiếm và có giá trị trong vòng lặp này là phán đoán của bạn, không phải tốc độ gõ phím của bạn. Tôi càng chấp nhận mình chỉ là "tín hiệu con người", không còn cố gắng đồng thời làm người trực tiếp thao tác, thì tôi càng giao được nhiều thứ hơn.

Bạn phụ trách gu thẩm mỹ. Để chúng phụ trách thao tác.

Mẹo

Dùng bộ não của bạn để chỉ huy agent, tạo thêm giá trị cho thế giới. Bộ não của bạn vẫn có giá trị.

13. Làm video với HyperFrames, làm mọi thứ video với nó

Trước đây video là thứ tôi thuê ngoài hoặc bỏ qua. Giờ đây cách tôi làm video cũng giống như mọi thứ khác: tôi nói, agent xây dựng, tôi phản hồi.

HyperFrames cho phép tôi chuyển video thành HTML, vì vậy agent có thể viết nó. Vòng lặp và viết code hoàn toàn giống nhau, chỉ khác là đầu ra thay đổi từ PR thành MP4. Mỗi video là một thư mục, bên trong có một file script.md, viết kịch bản theo từng cảnh, bao gồm phông chữ động, phụ đề và từng điểm nhịp điệu. Agent sẽ biến kịch bản thành hình ảnh tổng hợp và render ra. Không cần biên tập viên, không cần timeline.

Các video ra mắt tôi đã làm theo cách này bao gồm:

Granola CLI demo

Agent Cookie launch

Video ra mắt của Agent Cookie được thực hiện bằng HyperFrame.

Chi phí video giảm xuống chỉ còn một lần hội thoại, vì vậy bất cứ thứ gì xứng đáng có video, giờ đây sẽ có video: đoạn giới thiệu ngắn, demo sản phẩm, video giải thích hoạt hình, clip có phụ đề. Chúng không chỉ được đăng trên X. Tôi thậm chí còn đặt trực tiếp demo đã render vào PR, như PR này trong dự án atlas-lean của Facebook AI Research.

Mẹo

Làm video bằng HyperFrames: Viết một file script.md, để agent của bạn render nó thành MP4.

Tải GIF lên catbox, chúng sẽ hiển thị đẹp mắt trên GitHub, PR, README và issue.

14、Ghi chú của bạn là kho kiến thức của agent

Mẹo strategy-folder hồi tháng Ba sau đó tôi đã tổng quát hóa. Một kế hoạch ngày càng tốt hơn mỗi lần vì Claude có thể truy cập vào mọi kế hoạch tôi từng viết trước đó. Đây là lợi thế lũy kế của ngữ cảnh. Vì vậy, tôi đã để nó trỏ đến toàn bộ bộ não của mình.

Các công cụ tôi cho nó truy cập bao gồm:

Bear, kết hợp với Bear CLI. Ghi chú, biên bản cuộc họp, ý tưởng dang dở và quyết định trong mười năm qua, agent có thể đọc và ghi. Đây là RAG cá nhân, chỉ là không gọi tên như vậy. Càng đưa nhiều thứ vào, mỗi session càng thông minh hơn.

Obsidian. Tôi không tự dùng, nhưng nhiều người rất thích dùng nó cho việc này, và hệ sinh thái plugin của nó rất sâu.

gbrain. Bộ não đồng bộ giữa các máy và agent của tôi.

supermemory. Một lớp ghi nhớ cho agent được nhiều người khuyên dùng. Tôi đang nghiên cứu sâu, kết luận sẽ nói sau.

Hình thức của mẹo này mới là trọng tâm: chọn một công cụ ghi chú có CLI hoặc API, trỏ agent vào đó, để kiến thức của bạn bắt đầu sinh lãi kép.

Mẹo

Hãy để agent của bạn kết nối đồng thời hai loại công cụ: một là công cụ bạn tự viết ghi chú, như Bear, Obsidian; loại kia là "bộ não" ghi nhớ cho agent, như gbrain, supermemory. Chọn những công cụ có CLI hoặc API để agent có thể đọc chúng.

15. Làm việc mọi lúc mọi nơi: Mac mini của tôi

Mẹo

Mosh, dùng khi bắt buộc phải SSH vào. Nó giữ cho session mượt mà và phản hồi nhanh như local ngay cả trong môi trường Wi-Fi tệ và mạng di động. Trên SSH thông thường, Claude Code sẽ chậm như rùa bò, mỗi lần nhấn phím đều phải chờ round-trip mạng. Sự khác biệt mà Mosh mang lại chính là ranh giới giữa "dùng được" và "đau khổ".

Tmux, dùng trên máy bay. SSH vào máy từ xa trong một tmux session, công việc sẽ chạy trên máy từ xa, không phải trên laptop của bạn. Khi bay qua Đại Tây Dương, Wi-Fi mất 20 phút, bạn kết nối lại, attach vào, mọi thứ vẫn ở nguyên vị trí bạn rời đi. Tôi từng liên tục giao tính năng trong suốt chuyến bay từ châu Âu về.

Hermes và OpenClaw chạy đồng thời, dùng cho công việc từ xa tự động. Hermes là một hệ sinh thái tự học hỏi và dần cải thiện qua các tác vụ lặp lại; OpenClaw lại mạnh về bề rộng kỹ năng xây dựng agent. Tôi chuyển đổi giữa cả hai. Nếu bạn đã từ bỏ OpenClaw từ sớm, hãy xóa sạch nó và bắt đầu lại.

Agent Cookie dùng để đồng bộ cookies và file .env giữa Mac mini và Mac chính của bạn.

16. Proof: Gửi kế hoạch cho đồng nghiệp

plan.md hoàn hảo với tôi, nhưng nếu gửi nó cho một người không sống trong terminal, thì hoàn toàn vô dụng. Đây là lỗ hổng thực sự cuối cùng, và Proof, cũng đến từ Every, đã lấp đầy nó.

Mở một kế hoạch trong Proof và đọc nó như một tài liệu – điều này đã khá tốt. Nhưng nó thực sự trở nên không thể thiếu khi bạn gửi kế hoạch cho đồng nghiệp. Tôi ném plan.md hoặc spec vào Proof, gửi link, và một người không dùng terminal cũng có thể đọc rõ ràng, comment trực tiếp, và những comment đó lại quay ngược vào vòng lặp của agent. Không còn phải dán markdown vào Slack rồi nhìn nó render thành một đống rác nữa. Đây là lớp kiểm duyệt con người trong toàn bộ quy trình làm việc với file kế hoạch, và cũng là lần đầu tiên tôi cảm thấy việc chia sẻ công việc agentic với một đồng nghiệp bình thường không còn ngượng ngùng.

Khi viết bài này, tôi cũng đã đưa nó vào Proof. Và nó đã được review như vậy.

Hơn nữa, toàn bộ bài viết tôi đều viết trong cmux, trong khi mở Proof review ở bên cạnh.

Mẹo nhỏ

Chia sẻ một kế hoạch: ném file .md vào Proof, gửi link, rồi kéo comment trở lại vòng lặp làm việc.

17. Viết kỹ năng của riêng bạn

Nâng cấp lớn nhất không phải là sử dụng agent, mà là dạy chúng những kỹ năng có thể tồn tại lâu dài. Bất cứ điều gì tôi làm hơn hai lần, tôi đều biến nó thành một skill: một lệnh có thể tái sử dụng mà agent có thể chạy vĩnh viễn sau này. Hãy viết skill của riêng bạn trước, dùng nó để tự động hóa quy trình làm việc của bạn.

Bạn không cần phải viết từ đầu. Mẹo thực sự để mở khóa điều này là để agent của bạn xem một skill đã hoạt động hiệu quả, rồi sao chép cấu trúc của nó. Nghĩa đen là: "Hãy xem skill Compound Engineering, giúp tôi tạo một cái tương tự cho [việc tôi muốn tự động hóa]." Nó sẽ đọc một ví dụ tốt, học cấu trúc, và dựng khung cho tôi. Đó là cách tôi tạo ra hàng loạt skill.

Điều này gần như đã trở thành phần lớn cuộc sống mã nguồn mở của tôi hiện tại. Nếu bạn nhìn vào GitHub của tôi, bạn sẽ thấy công việc của tôi chỉ là các skill và các công cụ xoay quanh chúng. last30days ban đầu chỉ là một skill tôi tự làm cho mình, giờ đã mã nguồn mở và vượt quá 26.000 Star. Printing Press là một nhà máy hoàn chỉnh tạo ra CLI gốc agent, cũng là công cụ tôi dùng nhiều nhất, và tôi đã merge hơn 320 PR cho nó. Tôi cũng là một trong những người đóng góp chính cho Compound Engineering. Tất cả không phải là một kế hoạch lớn lao. Mỗi thứ chỉ là một quy trình làm việc tôi chạy thường xuyên, đến mức đáng để agent trở nên vĩnh viễn giỏi về nó.

Viết một skill. Sau đó mỗi session sẽ nhanh hơn. Đó chính là phần lãi kép trong Compound Engineering.

Kỹ năng

Bất cứ điều gì bạn làm hơn hai lần, hãy biến nó thành một skill: Hãy xem skill Compound Engineering, giúp tôi tạo một cái tương tự cho [X].

18. Mã nguồn mở: Đóng góp cho dự án bạn yêu thích

Cùng một vòng lặp giúp tôi bàn giao dự án của mình cũng có thể giúp người khác bàn giao dự án. Tôi đã có hàng trăm PR được hợp nhất vào các dự án mã nguồn mở, bao gồm Python, Go, OpenCV, Agent Browser của Vercel và OpenClaw. Không phải loại PR sửa lỗi chính tả tiện thể, mà là các tính năng thực sự trong những công cụ tôi dùng hàng ngày.

Không biết từ lúc nào, tôi đã xuất hiện ở top đầu trong danh sách người đóng góp của một số dự án:

Hạng 3 trong Compound Engineering, Superpowers và Emdash.

Hạng 4 trong GStack và Paperclip.

Hạng 6 trong Vercel Agent Browser.

Hạng 2 trong Camoufox.

@pejmanjohn nói đùa rằng giờ đây mỗi khi mở một repo, việc tìm thấy mặt tôi trong lưới ảnh đại diện người đóng góp đã trở thành phiên bản cá nhân của trò "Tìm Wally" đối với anh ấy.

Nhưng PR được hợp nhất không phải là phần thưởng thực sự. Phần thưởng thực sự là con người. Tôi sẽ vào Discord, gặp gỡ những người bảo trì, và kết bạn thực sự. Điều này cũng rất hữu ích cho việc tuyển dụng. Tôi vừa mới thuê một kỹ sư cho công ty mới của mình thông qua cách này. Bạn đóng góp cho một dự án mình yêu thích, bạn sẽ gặp những người cũng yêu thích nó, và rồi điều này tiếp tục sinh lãi kép.

Kỹ năng

Chọn một công cụ bạn dùng hàng ngày, tìm ra một thứ thực sự thiếu trong đó, và dùng cùng một vòng lặp /ce-plan + /ce-work để tạo ra nó.

Xuất hiện trong Discord của dự án này. PR đưa bạn vào cửa, con người mới là lý do bạn ở lại.

Gia tăng giá trị trên X.
Trên X, hãy chi từ 1 đến 3 đô la mỗi tháng để đăng ký những người bạn tôn trọng. Tôi chi 1 đô la mỗi tháng để đăng ký @garrytan. Như vậy khi tôi gửi PR, tôi có thể gửi bài đăng X cho anh ấy, và anh ấy sẽ nhận được thông báo đặc biệt rằng tôi là người đăng ký trả phí. Tôi cũng đăng ký trả phí @jason, @teknium, @Teknium.

19. Cấu hình laptop hiện tại của tôi

Chiếc laptop hai năm tuổi của tôi gần như không thể sử dụng được với khối lượng công việc hiện tại: chạy sáu phiên Claude cùng lúc suốt cả ngày, cộng thêm Codex. Vì vậy tôi đã nâng cấp lên M5 Max, RAM 64GB. Nó là một con quái vật, tôi rất thích. Nhưng khối lượng công việc này vẫn có thể làm nó quá tải: chiếc máy hoàn toàn mới của tôi chỉ trụ được tối thiểu một giờ pin.

Vì vậy tôi bắt đầu mua sạc dự phòng trong hoảng loạn. Hiện tôi mang theo một cục sạc Anker bên mình, và cũng để một bộ sạc Anker trong xe, để Tesla có thể sạc lại cho tôi trên đường.

Mẹo

Không bao giờ ngủ: sudo pmset -a disablesleep 1

Mang theo một cục sạc Anker bên mình; để một bộ sạc trong xe.

20. Printing Press: Chạy CLI ngoài đời thực

Hầu hết các mẹo này đều sống trong terminal. Mẹo này thì bước ra ngoài terminal. Printing Press là một bộ CLI bao bọc các dịch vụ thực tế, cho phép agent trực tiếp chạy việc vặt cho bạn. Nó hiện đã là một dự án độc lập, tài khoản @ppressdev, hơn 3700 Star, và tôi đang làm cùng @trevin.

Thứ thực sự khiến các công cụ này hoạt động được là xác thực, và nó đã được phát hành tối qua: Agent Cookie. Nó chuyển phiên trình duyệt thực của bạn cho CLI, để CLI hoạt động với danh tính của bạn, không cần dán mật khẩu hay xác thực lại. Nó biến "một agent biết về một dịch vụ nào đó" thành "một agent đã đăng nhập vào dịch vụ đó".

Một buổi chiều thực tế, từ đầu đến cuối: Làm nóng Tesla. Bọn trẻ lên xe sau mười phút: "Làm nóng xe lên 72 độ." Tesla CLI khởi động, xe đã ấm trước khi chúng tôi ra ngoài.

Instacart. "Thêm Corona vào giỏ hàng Costco trên Instacart."

ESPN polling. Một phiên giúp tôi theo dõi trận đấu, chỉ cảnh báo khi tỷ số sát nút. Tôi không cần refresh bất cứ thứ gì, chỉ nhận được thông báo thực sự quan trọng đó.

Hành trình Alaska Airlines cho bọn trẻ. Nó kéo giá vé và giá của vài ngày trước sau, kiểm tra số dư Atmos của chúng tôi, đưa kết quả vào /ce-plan, sau đó đưa ra chiến lược đặt vé, bao gồm ngày rẻ nhất và lời nhắc mua. Toàn bộ quá trình diễn ra bên lề sân bóng.

Đây không chỉ là "AI giúp tôi viết code". Agentic Engineering sẽ giúp bạn chạy việc vặt, theo dõi trận đấu, làm nóng xe, đặt chuyến du lịch, trong khi bạn có thể làm những việc khác.

Mẹo

Cài đặt CLI có sẵn từ thư viện printingpress.dev, giao một công việc trực tiếp cho agent của bạn.

Auth không đau đớn: Agent Cookie sẽ chuyển session trình duyệt thật của bạn cho CLI, để nó thao tác dưới danh tính của bạn.

Mẹo thực sự là: tự in một cái. Giao một việc bạn làm cả ngày, một API nào đó, hoặc một dịch vụ bạn không thể thiếu cho Printing Press, để nó tạo ra một CLI agent-native. Công cụ bạn xây dựng cho quy trình làm việc của chính mình mới là công cụ thực sự thay đổi cách bạn làm việc.

21, Hãy thành thật: Nghiện ngập kiểu AI mất kiểm soát

Agent lẽ ra phải hoàn thành tất cả công việc cho chúng ta. Kết quả là, mọi người bạn tôi quen đều đang trải qua giai đoạn làm việc căng thẳng nhất trong đời.

Phản hồi đơn giản nhất là: nghỉ ngơi một chút, đi chạm vào cỏ. Nhưng vấn đề không nằm ở đó. Vấn đề là nghiện. Xây dựng mọi thứ bằng agent là trò chơi điện tử vĩ đại nhất thế giới, và vòng lặp của nó quá mạnh mẽ.

Tôi thực sự lo lắng cho một số người bạn. Họ bị đốt cháy hoàn toàn vì đột nhiên có thể xây dựng bất cứ thứ gì, và thế là họ không làm gì ngoài việc xây dựng. Sau đó họ ra mắt sản phẩm, nhưng không có người dùng. Điều đó cũng không sao. Tôi cũng từng ra mắt nhiều thứ không có người dùng. Cái bẫy không phải là ra mắt mà không ai dùng, mà là bạn biến mất trong việc xây dựng và đánh mất những người xung quanh.

Vì vậy hãy cẩn thận. Nói chuyện với người bạn yêu thương. Tự hỏi bản thân, liệu có ai thực sự muốn thứ bạn đang làm không. Nếu câu trả lời trung thực là: đây chỉ là một công cụ cho chính bạn, thì cũng không sao. Một số thứ tốt nhất tôi từng làm vốn dĩ chỉ dành cho bản thân mình.

Nếu bạn thực sự muốn có khán giả, hãy đi theo con đường nội dung mà Gary Vaynerchuk luôn nói. Bạn bắt đầu từ một nơi nào đó, phát hành vào khoảng không, hy vọng có một người chú ý. Rồi ba người, mười người, một trăm người, và cuối cùng từng bước tiến tới vài nghìn người. Không ai bắt đầu với vài nghìn người. Bất cứ thứ gì bạn xây dựng cũng vậy.

Mẹo

Nghỉ ngơi một chút. Đi chạm vào cỏ.

Nói chuyện với người bạn yêu thương.

Làm thứ gì đó mà ai đó muốn, dù "ai đó" chỉ là chính bạn.

Bài viết này được viết ra như thế

Đây chỉ là một file markdown. Claude Code chạy trong cmux, tôi nói chuyện với Monologue: "Tối ưu đoạn mở đầu no-IDE", "Làm phần don't-read-the-plan cay hơn một chút", "Thêm câu chuyện về Tesla và Instacart". Nó viết lại, tôi phản hồi, rồi bài viết vào Proof để duyệt. last30days cung cấp tài liệu mới. Nhân tiện, lần này không dùng Zed. Tôi không dùng nó nữa. Không IDE. Không gõ code. Nói chuyện, lên kế hoạch, xây dựng. Từ bàn làm việc, ghế sofa, xe hơi, bên cạnh sân bóng – đều được.

Đây là tất cả những gì tôi biết tính đến tháng Sáu: một App giọng nói, một plugin file kế hoạch, vài thay đổi cấu hình, một đống tab, một Mac Mini, hai máy từ xa, và một đội tàu CLI có thể vận hành cuộc sống thực tế.

Mẹo

Sao chép toàn bộ bài viết này, dán cho agent của bạn, bảo nó giúp bạn thiết lập mọi thứ được đề cập ở đây. Quy trình làm việc agentic engineering của bạn sẽ có những điều tốt đẹp xảy ra.

[Liên kết gốc]

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

#trí tuệ nhân tạo

Báo lỗi/Báo cáo