BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Karpathy gia nhập Anthropic có ý nghĩa gì đối với Claude?

Đọc bài viết này mất 31 phút

Đây là dấu hiệu của Claude chuyển từ Công cụ AI thành Nhân viên AI

原文标题：Karpathy Tham Gia Anthropic Thực Sự Có Ý Nghĩa Gì Đối Với Claude
原文作者：@nateherk
Biên Dịch: Peggy, BlockBeats

Biên tập viên ghi chú: Sự gia nhập của Andrej Karpathy vào Anthropic không chỉ là một tin tức nhân sự về "Ngôi sao AI gia nhập phòng thí nghiệm hàng đầu". Điều đáng chú ý hơn là sự thay đổi về hướng sản phẩm mà sự thay đổi nhân sự này ám chỉ.

Trước đó một năm, trọng điểm cạnh tranh trong ngành AI vẫn tập trung nhiều vào chính mô hình: người sử dụng benchmark nào cao hơn, khả năng suy luận của ai tốt hơn, ai đứng đầu bảng xếp hạng. Nhưng khi năng lực sản phẩm như Claude Code, Kỹ năng, MCP, bộ nhớ dự án, luồng công việc Agent ngày càng hoàn thiện, một xu hướng rõ ràng đang xuất hiện: mô hình chính chỉ là một lớp của sản phẩm, điều quyết định hiệu suất đầu ra của người dùng thực sự là ngữ cảnh bọc mô hình, bộ nhớ, luồng công việc, kỹ năng, kết nối, cấu trúc tệp, hướng dẫn về phong cách và chu trình mục tiêu.

Khái niệm "kỹ thuật ngữ cảnh" mà Karpathy đã nhấn mạnh liên tục trong vài tháng qua chính xác tương ứng với sự thay đổi này. Điều quyết định xem AI có thể tạo ra giá trị ổn định không chỉ là một câu lệnh người dùng viết xuống, mà là mô hình có thể hiểu tài liệu của bạn, luồng công việc, tiêu chuẩn phong cách, mục tiêu doanh nghiệp và hệ thống đánh giá của bạn. Nói cách khác, cạnh tranh giai đoạn tiếp theo của AI có thể không còn là về "mô hình của ai mạnh hơn" mà là về ai có thể đưa mô hình vào bối cảnh làm việc thực sự tốt hơn.

Từ LLM Wiki đến AutoResearch, rồi đến kiểu chu trình như /mục tiêu, hướng dẫn bởi Karpathy luôn khám phá công khai hướng đi với một câu hỏi: làm thế nào để biến AI từ "cửa sổ trò chuyện trả lời câu hỏi" thành một hệ thống làm việc có khả năng hiểu ngữ cảnh, thực thi nhiệm vụ liên tục, lặp lại xung quanh mục tiêu. Và sự triển khai gần đây của Anthropic trong các khả năng Claude Code, dịch vụ doanh nghiệp, kết nối sinh thái và luồng công việc cũng đang theo đuổi cùng hướng điều này.

Do đó, ý nghĩa của việc Karpathy tham gia Anthropic không chỉ là một sự di chuyển nhân sự mà giống như một dấu chân cho hướng phát triển sản phẩm của Anthropic: Công cụ AI trong tương lai, giá trị không chỉ nằm trong các tham số mô hình mà còn trong dữ liệu mà người dùng đã đổ vào, luồng công việc, hệ thống bộ nhớ và kiến thức ngành. Ai có thể tổ chức các ngữ cảnh này lại, ai có thể thực sự đưa AI từ "công cụ" tới "cơ sở hạ tầng".

Dưới đây là nguyên tác:

Cách đây vài giờ, Andrej Karpathy đã đăng bài thông báo rằng anh sẽ gia nhập Anthropic.

Phiên bản đơn giản nhất của câu chuyện này là: một chuyên gia AI đã gia nhập một phòng thí nghiệm AI lớn.

Nhưng vấn đề đáng quan tâm hơn là: Tại sao lại là Anthropic? Và tại sao lại là bây giờ?

Bởi vì chỉ cần bạn nhìn lại những gì Karpathy đã công khai xây dựng trong vài tháng qua, sau đó nhìn vào những tính năng mà Claude Code liên tục tung ra gần đây, bạn sẽ nhận ra rằng cả hai đã dường như từ lâu đã hướng tới một hướng sản phẩm chung.

Nền tảng

Karpathy là một trong những nhân vật quan trọng nhất trong lĩnh vực AI hiện đại.

Anh là một trong những thành viên sáng lập của OpenAI vào năm 2015, đã có 5 năm làm việc tại Tesla chịu trách nhiệm về doanh nghiệp AI; quay trở lại OpenAI vào năm 2023, rời đi một năm sau; sau đó thành lập công ty giáo dục AI của riêng mình, Eureka Labs. Anh ấy cũng đã ra mắt LLM 101n, một khóa học miễn phí, dạy người dùng cách xây dựng một mô hình ngôn ngữ từ đầu.

Anh cũng là người đề xuất ý tưởng về "vibe coding": bạn chỉ cần mô tả bằng tiếng Anh những gì bạn muốn, để AI viết mã, sau đó liên tục cảm nhận, hướng dẫn, và lặp lại quá trình. Anh cũng đề xuất khái niệm "context engineering" (kỹ thuật ngữ cảnh), điều này sẽ trở thành chìa khóa trong phần thảo luận tiếp theo của bài viết này.

Vì vậy, điều này không chỉ đơn giản là một lần tuyển dụng thông thường. Điều này có nghĩa là một trong những giọng nói có ảnh hưởng nhất trong lĩnh vực AI đã gia nhập một trong những phòng thí nghiệm AI mạnh mẽ nhất hiện tại.

Claude Code đã trở thành công cụ ưu tiên của nhiều nhà xây dựng khi xây dựng Agent, viết mã, hoặc xử lý công việc tri thức thực sự. Khoảng một tuần trước, Ramp đã phát hành Chỉ số AI của mình. Theo dữ liệu này, Anthropic lần đầu tiên vượt qua OpenAI về tỷ lệ áp dụng doanh nghiệp: 34,4% so với 32,3%.

Tất nhiên, để công bằng, đó chỉ là dữ liệu từ nhóm khách hàng của Ramp. OpenAI vẫn giữ thương hiệu mạnh mẽ trong tiêu dùng và vẫn có nhiều hợp đồng doanh nghiệp không được tính trong số mẫu này. Tôi không muốn phóng đại vấn đề này, nhưng tín hiệu này thực sự không thể bỏ qua.

Trong tháng này, Anthropic cũng đã công bố việc thành lập một công ty dịch vụ AI mới. Đây là một liên doanh do Anthropic phối hợp với Blackstone, Hellman & Friedman, Goldman Sachs thành lập, mục tiêu là giúp các doanh nghiệp vừa phải đưa Claude vào quy trình kinh doanh cốt lõi.

Hãy nhìn lại hành động này: họ đang xây dựng mô hình, cũng như các cửa ngõ sản phẩm như Claude Code, Skills, MCP; họ đồng thời đang xây dựng mạng lưới đối tác; và bây giờ lại bổ sung thêm một lớp khả năng dịch vụ, giúp các doanh nghiệp thực sự triển khai sản phẩm.

Điều này không còn là trò chơi "đưa cho bạn một mô hình, phần còn lại bạn tự lo" nữa.

Wrapper Mới Là Sản Phẩm

Ngày nay, hầu hết cuộc trò chuyện về AI vẫn coi mô hình là sản phẩm hoàn chỉnh: mô hình nào chiến thắng trên chỉ số nào, Opus 4.7, GPT-5.5, Gemini ai mạnh hơn, bảng xếp hạng thay đổi như thế nào.

Mô hình tất nhiên quan trọng, tôi không nói rằng mô hình không quan trọng. Nhưng càng sử dụng các công cụ này lâu, ta càng cảm thấy rõ ràng: mô hình chỉ là một lớp của sản phẩm. Điều thực sự thay đổi sản phẩm mà bạn tạo ra hàng ngày, là lớp wrapper bên ngoài mô hình đó.

Đó cũng chính là lý do tại sao hai người sử dụng cùng một mô hình, cuối cùng lại nhận được kết quả hoàn toàn khác nhau.

Được gọi là wrapper, đó chính là mọi thứ quyết định cách mà mô hình được sử dụng.

→ Chính Claude Code, Codex, Skills, Subagents, Hooks, MCP Connector.

→ Tập tin CLAUDE.md của bạn, bộ nhớ của bạn, tài liệu của bạn, trường hợp của bạn.

→ Cấu trúc tệp của bạn, hướng dẫn về phong cách của bạn, và cách bạn định nghĩa "kết quả tốt" thực sự.

Đây chính là môi trường mà mô hình hoạt động.

Nếu bạn mở một cửa sổ trò chuyện hoàn toàn mới, không có bất kỳ ngữ cảnh nào, và sau đó cho nó giúp bạn giải quyết vấn đề kinh doanh, nó không biết gì về bạn, chỉ có thể đoán. Vì vậy, bạn phải giải thích lặp đi lặp lại trong cuộc trò chuyện về lịch sử mà bạn đã nói mười lần.

Nhưng nếu bạn cung cấp cho nó tệp tin của bạn, các trường hợp, quy trình làm việc, hướng dẫn phong cách và tiêu chuẩn thành công thực sự, cùng một mô hình, kết quả sẽ hoàn toàn khác nhau.

Đó chính là nơi mà Karpathy và Anthropic phù hợp. Lí do mà anh ấy đưa ra "context engineering" (kỹ thuật ngữ cảnh), thay vì tiếp tục ở mức "prompt engineering" (kỹ thuật dấu nhắc), chính là vì lý do này. Khả năng thực sự quan trọng, không phải là việc viết một dấu nhắc hoàn hảo, mà là xây dựng môi trường đúng, để mô hình có thể thực sự hoạt động và ghi nhớ sử dụng ngữ cảnh giữa các cuộc trò chuyện.

Anthropic luôn âm thầm xây dựng môi trường này. Karpathy luôn công khai giảng dạy phương pháp này. Bây giờ, hai bộ khái niệm này đã hội tụ vào cùng một công ty.

Khi đã hiểu như vậy, những gì Karpathy đã thực hiện công khai trong vài tháng qua không còn giống như một tập hợp các dự án ngẫu nhiên nữa, mà hơn giống như một bản đồ con đường.

LLM Wiki và Phòng Bò của Dữ Liệu của Bạn

Vào tháng 4 năm nay, Karpathy đã phát hành LLM Wiki. Dự án này nhanh chóng trở nên phổ biến trên X.

Cấu trúc của nó rất đơn giản. Nếu bạn muốn hiểu hơn, tôi cũng đã làm mộthướng dẫn trên YouTube đầy đủ.

→ Một thư mục raw/, chứa nhiều tệp markdown, có thể là ghi chú, nguồn thông tin, bản trích ý, bất kỳ tài liệu nào cũng được.
→ Một thư mục wiki/, được Agent tổng hợp tất cả nội dung, xây dựng liên kết giữa các tài liệu và tạo ra bản đồ tư duy.
→ Một tài liệu schema, tương tự như CLAUDE.md hoặc AGENTS.md, để cho Agent biết làm thế nào hệ thống này hoạt động và làm thế nào để tiếp thu tài liệu mới.

Nó không phải là để trí tuệ nhân tạo tìm kiếm tệp nguồn, cũng không phải chỉ chạy một lần truy vấn vector, mà là để trí tuệ nhân tạo xây dựng một cơ sở tri thức sống, không ngừng tiến hóa. Nhiều người đã bắt đầu sử dụng nó để xây dựng "bộ não thứ hai" của họ.

Điều này quan trọng hơn so với vẻ bề ngoài của nó. Nhiều người nói "Dữ liệu là Phòng Bò" khi ý nghĩ đến một cơ sở dữ liệu doanh nghiệp lớn. Nhưng với người xây dựng thông thường, Phòng Bò thực sự hẹp hơn, cũng như thực tế hơn.

Đó có thể là ghi chú cuộc họp của bạn, SOP nội bộ, bản ghi cuộc gọi của khách hàng, bản trích ý, cấu trúc đặt tên bạn thường sử dụng và các khung công việc thực sự thuộc về bạn.

Nếu Claude có thể chuyển đổi nội dung này thành ngữ cảnh mô hình đồng áng, hữu ích, thì với bạn, mô hình này sẽ trở nên thông minh và hữu ích hơn mỗi tuần.

Đó là hiệu ứng khóa. Không phải vì bạn không thể thay đổi mô hình, dĩ nhiên bạn có thể thay đổi. Nhưng khi bạn liên tục xây dựng ngữ cảnh, quy trình làm việc và ký ức trong một công cụ nào đó, thì càng lâu, bạn sẽ càng khó rời đi.

LLM Wiki không chỉ là một dự án phụ. Đó là một dấu vết. Tôi sẽ không ngạc nhiên nếu trong tương lại xuất hiện các tính năng tương tự nhưng nguyên bản hơn trong Khoá học Claude hoặc Dự án Claude. Bạn đã có thể thấy một số dấu hiệu trong tính năng auto-dream.

Tất nhiên, bạn không cần phải chờ đợi. Cuối tuần này, bạn có thể tự mình làm, để Claude Code đọc tài liệu quan trọng của bạn và xây dựng một wiki theo cách đó.

Nếu bạn muốn trở thành người theo đuổi AI đầu tiên của mình, dữ liệu của bạn chỉ có giá trị khi Điều Phối Viên biết cách tìm thấy nó và sử dụng nó đúng cách.

AutoResearch và Vòng Lặp /Mục Tiêu

Vào tháng 3 năm nay, Karpathy đã phát hành một dự án có tên là AutoResearch. Đó là một vòng lặp nghiên cứu tự động. Nếu bạn đã từng chơi Ralph Loop, bạn sẽ thấy rằng cả hai có một số điểm tương đồng về cách tiếp cận.

Mô hình của nó đại khái là:

1. Nhận một đoạn mã huấn luyện.

2. Đề xuất một phương án sửa đổi.

3. Chạy một nhiệm vụ huấn luyện ngắn.

4. Kiểm tra kết quả dựa trên các chỉ số khách quan: thành công hay thất bại.

5. Lặp lại liên tục cho đến khi đạt được mục tiêu.

Thành thật mà nói, AutoResearch không phải là tính năng mà tôi sử dụng thường xuyên cá nhân. Tôi không huấn luyện mô hình, cũng không xây dựng ứng dụng nào cần vòng lặp như vậy. Nhưng hình dạng của nó rất quan trọng.

Xác định mục tiêu. Để Điều Phối Viên làm việc. Quay lại sau khi hoàn thành.

Để xem xét việc cả hệ sinh thái vừa ra mắt gì: Codex có /mục tiêu, Hermes có /mục tiêu, Claude Code cũng có /mục tiêu gốc của riêng mình.

Tôi không nói rằng Karpathy cá nhân đã phát minh ra tính năng này. Tôi không biết. Và từ cấp cơ sở, AutoResearch và /mục tiêu không phải là cùng một thứ. Nhưng mô hình của chúng rõ ràng liên quan đến nhau.

Cả hai đều đang đưa chúng ta ra khỏi mô hình "một yêu cầu, một câu trả lời".

Họ đang đưa chúng ta tiến gần hơn đến một cách tương tác khác: đặt ra kết quả, để Điều Phối Viên tự quyết định cách thực hiện, và sau đó quay lại khi điều kiện được đáp ứng.

Đây chính là cách code vibe nâng cao. Xác định "muốn gì", không xác định "làm thế nào", và đợi nó hoàn thiện.

Một khi kết hợp mô hình này với cách tiếp cận của LLM Wiki, mọi thứ sẽ không còn giống như chatbot nữa. Nó bắt đầu trở thành một nhân viên thực sự: hiểu về doanh nghiệp của bạn và liên tục làm việc xung quanh một mục tiêu cho đến khi đạt được mục tiêu.

Giáo Dục là Dấu Hiệu Này

Trong thông báo gia nhập của Karpathy, có một câu xứng đáng được nhấn mạnh. Anh ấy nói: "Tôi vẫn duy trì niềm đam mê sâu sắc đối với giáo dục."

Eureka Labs, tức công ty trước đó của anh ấy, về bản chất là một dự án giáo dục. Mục tiêu của nó không phải là dạy người ta "nhấp vào nút này, kết nối các nút này", mà là giúp mọi người hiểu thực sự về trí tuệ nhân tạo: hệ thống đó hoạt động như thế nào.

Một điểm hiếm hoi của Karpathy là anh ấy có khả năng giải thích một cách dễ hiểu và gần gũi điều vô cùng kỹ thuật. Hiểu một điều là một sức mạnh. Nhưng dạy người khác hiểu và áp dụng thực sự mới là một sức mạnh hoàn toàn khác.

Điều này rất quan trọng đối với Anthropic. Nếu giai đoạn cạnh tranh tiếp theo xoay quanh bối cảnh, quy trình làm việc, Kỹ năng, Bộ nhớ và Chu kỳ, thì nút góc không chỉ là về công nghệ, mà còn bao gồm cả giáo dục.

Một nghiên cứu gần đây của IBM về việc áp dụng trí tuệ nhân tạo và quản lý biến đổi đã rõ ràng chỉ ra sự khác biệt lớn giữa việc các doanh nghiệp "sử dụng được AI" và "sử dụng AI hiệu quả thực sự". Đa số các doanh nghiệp đều đứng ở bước này.

Cho một người giỏi nhất về giáo dục AI gia nhập tổ chức, giúp thu hẹp khoảng cách này, đây không phải là một động thái nhỏ.

Ba Dự Đoán về Claude Code

Dưới đây chỉ là những dự đoán. Tôi không có thông tin nội bộ và không biết về bản đồ dự án của Anthropic. Nhưng dựa trên các sản phẩm mới nhất mà Anthropic đã phát hành, cùng với nội dung mà Karpathy đã công khai trong vài tháng qua, hướng đi đã khá rõ ràng.

Anthropic Sẽ Xây Dựng một "Cửa Hàng Ứng Dụng Bối Cảnh"

Họ đã bắt đầu thực hiện điều này. Các plugin chính thức, Kỹ năng và hệ thống phần mềm thành phẩm đang hình thành.

Nhưng tôi không nói về thị trường prompt.

Tôi nói về một loại thành phần: Kỹ năng, quy trình làm việc, bộ nhớ dự án, bối cảnh ngành nghề cụ thể, chu kỳ đánh giá và kết nối dữ liệu thực tế. Bao gồm các ví dụ có thể dạy cho mô hình biết điều gì là "tốt" trong một vị trí cụ thể.

Khi bạn tích hợp những thành phần này vào lĩnh vực của mình, bạn sẽ ngay lập tức nhận được giá trị cao hơn từ mô hình, ngay cả khi chính mô hình đã đủ thông minh.

Bởi vì với người dùng thông thường, mô hình chính nó đang dần trở thành một điểm tương đồng không còn độc nhất nữa. Vấn đề thực sự là: ai có thể xây dựng dữ liệu và wrapper đúng quanh mô hình, để nó tạo ra kết quả mang lại ROI thực sự cho doanh nghiệp.

LLM Wiki là một mô hình chuyển đổi thông tin lộn xộn thành bộ nhớ có thể sử dụng. /Goal là một mô hình chuyển đổi mục tiêu thành một vòng lặp tự động hóa. Công việc giảng dạy của Karpathy, tuy nhiên, là một mô hình biến các khái niệm AI phức tạp trở nên có thể sử dụng.

Điều thực sự được đóng gói bởi anh ấy là một cách hành vi. Nếu Anthropic có thể biến cách hành vi này thành một hệ sinh thái thực sự, Claude Code sẽ không chỉ còn là một công cụ lập trình mà sẽ trở thành một thị trường.

Trong sản phẩm sẽ xuất hiện nhiều hơn các lệnh kiểu /goal

/Goal rất có thể chỉ là phiên bản đầu tiên, không phải là hình dạng cuối cùng.

Có thể tưởng tượng, trong tương lai sẽ có nhiều phiên bản chuyên biệt: vòng lặp nghiên cứu, vòng lặp gỡ lỗi, vòng lặp kết thúc. Có thể cũng có các lệnh được tinh chỉnh cho các lĩnh vực dọc cụ thể, trong những kịch bản này, Tác nhân đã biết điều gì là "hoàn thành".

Tôi không biết chúng cuối cùng sẽ được gọi là gì, đó không phải là vấn đề chính.

Vấn đề là giao diện tương tác sẽ thay đổi. Bạn sẽ không còn nói "thực hiện bước này nữa," mà sẽ bắt đầu nói: "Trong kịch bản dọc cụ thể này, tiếp tục thực hiện cho đến khi điều kiện được thỏa mãn."

Anthropic sẽ triển khai một hệ thống giáo dục ẩn, giúp người dùng đóng gói luồng làm việc của họ

Đây là một dự đoán táo bạo nhất. Nói thật, đây cũng là điều tôi thấy thú vị nhất.

Nếu Anthropic muốn xây dựng một thị trường ngữ cảnh thực sự, người dân phải có thể tham gia đóng góp, không chỉ hướng vào nhà phát triển và nhà nghiên cứu.

Nghĩa là, các chuyên gia ngành từ các nghề nghiệp thông thường cũng nên có thể tham gia.

→ Người kiểm toán thực sự hiểu quy trình kết thúc tháng.

→ Người quản lý bất động sản biết từng bước nhập thông tin bất động sản.

→ Người làm YouTube hiểu rõ cái gì là đóng gói tốt, cái gì là đóng gói kém, và có thể tổ chức một buổi nghị sự từ đầu đến cuối.

Chúng lợi ích. Nhưng hiện tại, chúng đang bị thất thoát trong đầu người hoặc xao lạc trong tài liệu lộn xộn, các luồng Slack và kênh ClickUp.

Bạn đã có thể thấy dấu hiệu tương tự trong thế giới thực. Rất nhiều huấn luyện viên bắt đầu xây dựng phiên bản AI và chatbot riêng của họ và thu phí từ người dùng để họ có thể trò chuyện với các AI đó. Đó là bản thủ công. Mọi người muốn khai thác kiến thức chuyên môn của người khác và áp dụng nó vào doanh nghiệp của họ.

Nếu hôm nay tôi muốn xây dựng một Đại lý quảng cáo, tôi sẽ bế tắc. Bởi vì tôi không có kiến thức chuyên môn về lĩnh vực này. Nhưng nếu có một thị trường cho phép tôi đăng ký theo dõi bối cảnh chất lượng cao của một chuyên gia trong lĩnh vực nào đó, tôi sẽ ngay lập tức trở thành khách hàng.

Đó chính là tầng mà tôi sẽ tập trung trong tương lai.

Kết luận

Câu chuyện thực sự là mẫu thiết kế này.

Mô hình chỉ là một tầng của nó. Bọc bên ngoài của mô hình đang trở thành sản phẩm thực sự. Dữ liệu và luồng công việc của bạn đang trở thành hiệu ứng khóa thực sự. Những gì Karpathy đã dạy trong vài tháng qua và những gì Anthropic đã thực hiện trong vài tháng qua đều liên quan đến điều này.

Vì vậy, việc tham gia lần này không phải là một tiêu đề tin tức mới mà là một bản đồ con đường. Tôi đã phân tích logic toàn bộ trong video đầy đủ, liên kết được đặt trong phản hồi đầu tiên.

[Liên kết với bản gốc]

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

##trí tuệ nhân tạo

Báo lỗi/Báo cáo