BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Sau Claude Code, trào lưu tiếp theo của Anthropic sẽ là gì?

Đọc bài viết này mất 139 phút

Anthropic's Chief Product Officer Mike Krieger's Latest Interview

Tiêu đề Video: Sứ mệnh của Anthropic để tìm ra Claude Code tiếp theo
Tác giả Video: ACCESS Podcast
Dịch thuật: Peggy, BlockBeats

Chú thích biên tập viên: Trong bối cảnh khả năng mô hình lớn ngày càng tiến bộ, công cụ lập trình AI nhanh chóng trở nên phổ biến, cuộc thảo luận trong ngành đang chuyển từ "mô hình có thể hoàn thành nhiệm vụ" sang "khả năng của mô hình được tổ chức như thế nào thành sản phẩm, luồng công việc và hệ thống thương mại".

Trong suốt năm qua, các sản phẩm như Claude Code, Codex, Co-work đã liên tiếp xuất hiện trong cảnh lập trình viên và người làm việc tri thức, AI không còn chỉ là một hộp thoại trả lời câu hỏi mà bắt đầu trở thành một giao diện sản xuất có thể gọi được, thực hiện nhiệm vụ, xác minh kết quả. Nhưng khi "người đại diện sẽ trở thành thế hệ phần mềm tiếp theo" dần trở nên nhất trí, một vấn đề quan trọng hơn bắt đầu nổi lên: ai sẽ là người đầu tiên chuyển đổi khả năng của mô hình thành hệ thống làm việc có thể tái sử dụng, phân phối và mở rộng?

Bài viết này được tổng hợp từ cuộc phỏng vấn với Mike Krieger trên ACCESS Podcast. Mike Krieger là người sáng lập Instagram, hiện là Giám đốc Sản phẩm chính của Anthropic, chịu trách nhiệm cho Anthropic Labs, với mục tiêu dẫn đầu đội làm việc khám phá hướng phát triển sản phẩm mới của Anthropic sau Claude Code.

Alex Heath (Trái) và Mike Krieger (Phải)

Trong cuộc trò chuyện này, Mike Krieger không chỉ đơn giản thảo luận về sản phẩm tiếp theo của Anthropic, mà anh ấy đã phân tích cạnh tranh sản phẩm AI thành một nhóm vấn đề cấu trúc sâu hơn: làm sao khả năng của mô hình tiếp cận luồng công việc thực, doanh nghiệp AI nội bộ làm thế nào để tổ chức sáng tạo, các công ty nền tảng xử lý ranh giới với khách hàng sinh thái, và khi khả năng thực thi AI ngày càng mạnh mẽ, khả năng đánh giá của con người sẽ được đặt lại ở đâu trong chuỗi sản xuất.

Đầu tiên, là hình dạng sản phẩm chuyển từ "trò chuyện" sang "nhiệm vụ". Trước đây, mô hình lớn chủ yếu tồn tại dưới dạng hộp thoại, người dùng nhập prompt, mô hình tạo ra câu trả lời; hiện nay, logic sản phẩm như Claude Code, Co-work, Claude Design đại diện cho một loại logic sản phẩm khác: cho phép AI liên tục thúc đẩy công việc xung quanh một mục tiêu và trong quá trình đó gọi các công cụ, tạo ra kết quả, thực hiện xác minh. Điều này có nghĩa là, điểm then chốt của sản phẩm AI không còn là chất lượng câu trả lời mà là khả năng phân chia nhiệm vụ, liên tục thông tin ngữ cảnh, gọi công cụ và khả năng xác minh kết quả. Ai có thể đóng gói những khả năng này thành luồng công việc mạch lạc, ai sẽ gần hơn với cổng ngỏ năng suất thế hệ tiếp theo.

Thứ hai, là phương pháp tổ chức đã chuyển từ "Kế hoạch Nhóm lớn" sang "Thử nghiệm Nhóm nhỏ". Cách vận hành của Anthropic Labs giống như một đơn vị khởi nghiệp được nhúng vào bên trong một tập đoàn lớn: bắt đầu với hai ba người, xem xét hàng tuần mỗi hai tuần, sử dụng phản hồi tần suất cao để xác định xem dự án có tiếp tục tiến triển hay không. Trước đây, phòng thí nghiệm sáng tạo của các công ty lớn dễ mắc phải vào chu kỳ kéo dài, trách nhiệm mơ hồ và các dự án "không tệ" bị trì hoãn; bây giờ, mô hình đã giảm chi phí xây dựng, thực sự hiếm hoi là khả năng phán đoán, gu và tốc độ ra quyết định. Điều này có nghĩa là, hiệu quả tổ chức trong thời đại AI không chỉ phụ thuộc vào số lượng kỹ sư, mà còn phụ thuộc vào việc có thể sử dụng nhóm nhỏ hơn để xác minh hướng đi một cách nhanh chóng.

Thứ ba, là ranh giới giữa nền tảng và ứng dụng đang được định rõ lại. Sự thành công của Claude Code đã khiến cho Anthropic không chỉ là nhà cung cấp mô hình nữa, mà cũng bắt đầu tự thiết kế hình dạng ứng dụng; sự tranh cãi giữa Claude Design và Figma đã cho thấy rằng việc một công ty mô hình làm ứng dụng sẽ không thể tránh khỏi va chạm với lợi ích của khách hàng và đối tác sinh thái. Trước đây, các công ty mô hình cung cấp nhiều khả năng cơ bản, được hoàn thiện với giao diện người dùng và kịch bản bởi các ứng dụng dọc như Cursor, Figma; bây giờ, các công ty mô hình cũng cần thông qua sản phẩm của riêng mình để thể hiện hình dạng tương lai ưu tiên agent. Điều này có nghĩa là, cạnh tranh nền tảng AI không chỉ là cạnh tranh API, mà còn là cạnh tranh mô hình sản phẩm.

Thứ tư, là AI càng mạnh, đánh giá của con người càng hiếm hoi. Mike đã nhấn mạnh nhiều lần rằng, Claude có thể viết mã, tạo bản prototype, thực hiện các nhiệm vụ nhanh hơn, nhưng nó không thể thay thế phần khó khăn nhất của quá trình từ 0 đến 1: đặt ra câu hỏi đúng, hiểu người dùng thực sự, xác định định hình sản phẩm, và đánh giá điều gì mới là "chính xác". Trước đây, khả năng thực thi là rào cản chính trong công việc tri thức; bây giờ, việc thực thi đang được tăng tốc bởi mô hình, giá trị của con người đặt nhiều vào sự đánh giá trước, sự sáng tạo, mạng lưới mối quan hệ và khả năng tổ chức. AI sẽ không tự động xóa bỏ quyết định khó khăn, ngược lại, nó sẽ làm cho hướng đi sai bị phóng to nhanh chóng hơn.

Nếu việc trao đổi này được rút ngắn thành một quyết định, đó là: Sau Claude Code, Anthropic đang tìm kiếm không chỉ là một sản phẩm nổi bật duy nhất, mà một bộ phương pháp để biến số từ khả năng mô hình thành hệ thống sản xuất. Trong ý nghĩa này, đối tượng được thảo luận trong bài viết không chỉ là con đường sản phẩm tiếp theo của Anthropic, mà còn là sự chuyển về cấu trúc của toàn bộ ngành công nghiệp AI từ "cuộc thi mô hình" sang "cuộc thi hệ thống".

Dưới đây là nội dung gốc (đã được sắp xếp lại để dễ đọc và hiểu):

TL;DR

· Cuộc cạnh tranh sản phẩm AI đã chuyển từ "Mô hình mạnh mẽ hơn" sang "Cách thức triển khai năng lực," bản chất là các công ty mô hình lớn bắt đầu cạnh tranh giành lối vào quy trình làm việc.

·Ý nghĩa của Claude Code không chỉ là viết mã, mà là chứng minh rằng agent có thể tiếp tục thực hiện nhiệm vụ dưới một mục tiêu cụ thể, thúc đẩy AI từ công cụ trò chuyện đến hệ thống sản xuất.

·Giá trị cốt lõi của Anthropic Labs không phải là phát hành bao nhiêu sản phẩm, mà là sử dụng đội nhỏ để nhanh chóng xác minh mô hình tiếp theo cần có những khả năng gì.

·Co-work đại diện cho Anthropic muốn mở rộng phương pháp của Claude Code đến những người không phải là lập trình viên, bản chất là trừu tượng hóa "khả năng lập trình" thành khả năng tự động hóa công việc của người thông thường.

·Sự đuổi kịp của OpenAI Codex khiến lợi thế của Claude không chỉ là về công nghệ tiên tiến nữa, mà phụ thuộc vào việc Anthropic có thể kết hợp Claude Code, Co-work, Claude.ai thành một trải nghiệm thống nhất hay không.

·Công ty mô hình tự mình tham gia vào ứng dụng sẽ làm gia tăng sự xung đột ranh giới với khách hàng, nhưng đây cũng là một hướng đi tất yếu để họ định hình hình dạng sản phẩm AI thế hệ tiếp theo của mình.

·AI càng có khả năng thực thi nhanh, giá trị của con người càng tập trung vào đánh giá ban đầu, gu sản phẩm và định nghĩa vấn đề, vì hướng đi sai cũng sẽ bị AI phóng to nhanh hơn.

·Sự tác động của AI đối với việc làm không phải là vấn đề mà một công ty đơn lẻ có thể giải quyết, nó bản chất sẽ buộc xã hội phải thảo luận lại về việc tái tạo kỹ năng, cơ chế phân phối và khả năng không thể thay thế của con người.

Nội dung Gốc

Alex Heath (Người dẫn chương trình): Sau Claude Code, sản phẩm lớn tiếp theo của Anthropic sẽ là gì? Trong chương trình tuần này, chúng tôi đã mời Mike Krieger. Anh là người sáng lập Instagram, hiện đang phụ trách nhóm "dự án lên mặt trăng" bên trong Anthropic.

Mike Krieger (Giám đốc Sản phẩm Cấp Cao của Anthropic):
Trong số những ngày tôi làm việc tại Anthropic, một trong những ngày u ám nhất đó là khi chúng tôi quyết định đặt tên cho nó là 3.5 v2. Về việc tại sao cuối cùng chúng tôi chọn cái tên này, tôi có thể giải thích.

Alex Heath: Tôi và Mike đã ghi âm cuộc trò chuyện này khi chúng tôi đang ở San Francisco tham dự Hội nghị lớn Claude Code của Anthropic vừa rồi. Tại sự kiện đó, Anthropic đã thông báo đã đạt được một thỏa thuận hợp tác sức mạnh tính toán lớn mới với Elon Musk. Vậy, bây giờ bạn có lẽ sẽ cùng Elon lên vũ trụ?

Mike Krieger: Chính xác hoàn toàn. Vâng, chúng tôi đang tìm kiếm nguồn công suất tính toán mới, thậm chí là không ngờ đến.

Alex Heath: Chúng tôi đã trò chuyện về những gì Mike đang làm, cuộc cạnh tranh gay gắt giữa Anthropic và OpenAI, cũng như quan điểm của Mike rằng, ngay cả khi trí tuệ nhân tạo ngày càng mạnh mẽ, phần nào của công việc con người vẫn sẽ tiếp tục quan trọng.

Đây là "Access".

Mike, rất vui được gặp bạn tại Hội nghị Claude ở San Francisco. Tôi vừa mới nhớ lại cuộc trò chuyện trước đó của chúng ta. Lúc đó, bạn vừa mới giữ vai trò tại Labs không lâu, nhưng giờ đây đã là vài tháng rồi phải không?

Mike Krieger: Vâng, sắp đến 4 tháng.

Labs Hoạt động Như Thế Nào: Loại bỏ hàng tuần, xác thực sản phẩm lớn với nhóm nhỏ

Alex Heath: Gần 4 tháng rồi. Đối với những người không biết về Labs, tôi muốn bắt đầu từ đây. Bởi vì đây là một cấu trúc tổ chức khá đặc biệt. Khi tôi đến văn phòng của bạn vài tháng trước, chúng ta đã nói về điều này. Labs thực sự là gì? Nhiệm vụ của nó trong Anthropic là gì?

Mike Krieger: Để nói một cách đơn giản, theo quan điểm của tôi về Labs—phiên bản hiện tại, tôi sẽ gọi là Labs v2. Chúng ta có thể quay lại và nói về những gì Labs v1 đã làm, và Labs v2 muốn làm gì sau này.

Nhưng tôi nghĩ Labs chủ yếu thực hiện hai việc.

Thứ nhất, là làm giảm khoảng cách giữa khả năng lý thuyết của Claude và trải nghiệm hàng ngày của người thông thường. Nghĩa là, Claude lý thuyết có thể làm nhiều việc, nhưng làm thế nào những khả năng này thực sự trở thành phần của công việc và cuộc sống hàng ngày của con người? Chúng ta cần làm những sản phẩm, mô hình hoặc dự án nào để thể hiện làm thế nào để giải phóng thêm tiềm năng này, làm thế nào để làm giảm khoảng cách giữa chúng một cách tối đa?

Thứ hai, chúng tôi giống như một "tiểu đoàn trinh sát", để đánh giá xem hướng mà mô hình cần phát triển trong tương lai để đáp ứng nhu cầu của người dùng khác nhau.

Vậy nên, một dự án Labs thành công không nhất thiết là sẽ được phát hành cuối cùng. Nó cũng có thể là một bản prototype. Sau khi tạo ra, chúng tôi nhận thấy: mô hình hiện tại chưa đủ tốt, không thể hoàn thành nhiệm vụ tạm thời. Khi đó, chúng tôi sẽ để dành nó và đánh giá lại khi thế hệ mô hình tiếp theo được phát hành, hoặc biến nó thành một chỉ số đánh giá trong quá trình phát triển mô hình tiếp theo, sau đó tiếp tục phát triển.

Do đó, khác với phòng thí nghiệm sản phẩm của một công ty sản phẩm thuần túy, nơi mà tiêu chí thành công có thể là "bạn đã phát hành một sản phẩm chưa". Nhưng tại Anthropic, giá trị của Labs cũng có thể được thể hiện ở mặt khác: nó có thể ảnh hưởng đến hướng phát triển tương lai của Anthropic.

Alex Heath: Labs thực sự đã tạo ra một số sản phẩm nổi tiếng, phải không? Claude Code là một trong số đó, cũng như MCP. Còn những sản phẩm khác nữa?

Mike Krieger: Kỹ năng Agent cũng là một thứ rất quan trọng mà Labs đã phát triển. Ngoài ra, tôi cũng có thể kể về một dự án không được công bố vào thời điểm đó nhưng rất hữu ích cho nghiên cứu: việc sử dụng máy tính, nghĩa là cho Claude sử dụng máy tính.

Tôi đã tham gia vào Anthropic vào tháng 5 năm 2024. Tuần sau sẽ là kỷ niệm hai năm kể từ khi tôi gia nhập, chúng tôi gọi đó là "antiversary".

Alex Heath: Là kỷ niệm phải không?

Mike Krieger: Là antiversary. Mọi thứ trong Anthropic đều liên quan đến "ant". Ban đầu tôi khá chống đối. Chúng tôi cũng không nói "dogfood mà nói "antfood".

Sau khi gia nhập, chúng tôi bắt đầu xây dựng Labs. Một trong những dự án đầu tiên được đề xuất vào thời điểm đó là: tại sao không thử xem, cho Claude sử dụng một chiếc máy tính?

Alex Heath: Đó là việc sử dụng máy tính đúng không?

Mike Krieger: Đúng vậy.

Alex Heath: Đó là thời đại của mô hình nào?

Mike Krieger: Đó là Claude Sonnet 3.5. Đó cũng là mô hình đầu tiên mà tôi tham gia phát hành. Tôi bắt đầu làm việc trên việc phát hành ngay từ tuần thứ ba sau khi gia nhập. Chúng tôi thường đùa rằng, Anthropic không có dự án "onboarding", mà nó sẽ đưa ngay cho bạn một dự án rất khó khăn. Và tôi đã tham gia phát hành ngay trong tuần thứ ba.

Sonnet 3.5 là một mô hình rất thú vị, vì nó là một trong những mô hình đầu tiên thực sự mở khóa một phần của tình huống lập trình. Chưa đến mức độ lập trình hành vi toàn diện, nhưng đã có thể thấy dấu hiệu.

Vì vậy, chúng tôi đưa Sonnet 3.5 vào, và xây dựng một sản phẩm xung quanh nó với tên gọi computer use. Nhưng nó gặp rất nhiều vấn đề. Ví dụ, tốc độ sử dụng máy của nó quá chậm, độ chính xác không đủ cao, khả năng thị giác cũng không tốt. Nó có thể nhìn thấy màn hình, sau đó nói "tôi cần click vào nút đó", kết quả thực tế là nó đã click vào chỗ khác.

Tuy nhiên, việc thiết lập framework kiểm thử "không hoàn toàn sẵn có" này rất hữu ích. Vì sau này, khi chúng tôi thực hiện Sonnet 3.5 v2—cái tên này có thể sẽ được giải thích sau này, đó thực sự là một trong những ngày tối tăm nhất của tôi tại Anthropic—chúng tôi có thể đưa mô hình mới vào framework này để kiểm thử.

Sau đó, chúng tôi thử nghiệm với 3.6, vẫn chưa đủ tốt, nhưng đã có một chút tiến triển. Chuyển sang 3.7, tôi rất ấn tượng với ngày đó. Lúc đó tôi đang công tác tại New York, đi gặp đội tại New York. Đột ngột có người nhắn tin cho tôi rằng: Chúng tôi cảm thấy cái mà Labs đã thực hiện trước đó, cụ thể là dự án sử dụng máy tính trong chín tháng trước đó, thực sự bắt đầu cho thấy dấu hiệu sống trên Sonnet 3.7. Chúng tôi nghĩ rằng đã đến lúc coi sử dụng máy tính như một khả năng, và công khai thảo luận về nó.

Khoảng thời gian này kéo dài khoảng chín tháng. Chúng tôi đưa mô hình mới vào cùng một framework kiểm thử để thử mỗi vài tháng. Mặc dù Labs lúc đó đã tạm thời dừng dự án này, nó vẫn rất hữu ích, bởi nó trở thành một bộ kiểm tra để đánh giá sự phát triển của khả năng sử dụng máy tính trong mô hình.

Alex Heath: Khi bạn vừa gia nhập Anthropic, bạn là Giám đốc Sản phẩm. Tôi nhớ lúc đó tôi cũng nghĩ: Mike Krieger, người đồng sáng lập Instagram, trong ấn tượng của tôi là người sáng lập sản phẩm tiêu dùng, làm sao anh lại gia nhập một công ty AI doanh nghiệp?

Mike Krieger: Đúng vậy.

Alex Heath: Lúc đó chúng ta cũng có thể đã thảo luận về vấn đề này. Lúc đó tôi nghĩ rằng đó là một lựa chọn rất thú vị. Nhìn lại, đây là một quyết định đúng đắn. Tất nhiên, thời điểm cũng rất phù hợp.

Tôi rất tò mò, khi bạn đầu tiên tham gia với vai trò CPO, chịu trách nhiệm cho toàn bộ dòng sản phẩm. Và khái niệm "sản phẩm AI" chính nó đã hơi mơ hồ, và thay đổi rất nhanh. Bạn đã chuyển sang Labs khoảng bốn năm năm trước như thế nào? Theo thông tin của tôi, bạn giờ đây giống như một IC, nghĩa là người đóng góp cá nhân? Bây giờ bạn còn quản lý nhân sự không?

Mike Krieger: Hiện tại tôi không quản lý nhân sự. Chúng tôi chuẩn bị vào chu kỳ đánh giá hiệu suất.

Alex Heath: Vậy đó là điều bạn muốn, đúng không? Bạn muốn trốn khỏi việc viết đánh giá hiệu suất?

Mike Krieger: Đúng vậy. Tôi mở hệ thống lên, xem xét những gì phải viết trong đánh giá của mình, và phát hiện ra: bạn chỉ cần viết tự đánh giá của mình, cùng với đánh giá về sếp của bạn.

Alex Heath: Chỉ vậy thôi à?

Mike Krieger: Chỉ vậy thôi.

Alex Heath: Bây giờ Claude đến viết đánh giá hiệu suất à?

Mike Krieger: Claude thực sự sẽ giúp viết một số đánh giá, điều này rất hữu ích. Nó sẽ không viết hết cho bạn, nhưng ít nhất có thể giúp bạn nhớ lại: Trong 6 tháng qua, tôi đã làm gì?

Tôi nghĩ rằng công ty đã trải qua các giai đoạn khác nhau, những điều mà tôi thực sự đam mê ở mỗi giai đoạn là khác nhau.

Khi tôi mới gia nhập, cả đội ngũ sản phẩm và kỹ sư chỉ khoảng 30 người, có lẽ sản phẩm và kỹ sư mỗi phần chiếm một nửa. Tất nhiên, chúng tôi cũng có một số nhóm kỹ sư đang làm việc về cơ sở hạ tầng nghiên cứu, khả năng mở rộng, v.v., nhưng nếu chỉ xem xét người thật sự xây dựng xung quanh sản phẩm, thì vào thời điểm đó chủ yếu chỉ có Claude.ai và thứ mà lúc đó chúng tôi gọi là API - thời đó thậm chí chưa gọi là Nền tảng Claude - tổng cộng có thể chỉ khoảng 30 đến 35 người, rất ít ỏi.

Lúc đó, nó vẫn giống như một công ty khởi nghiệp giai đoạn sớm, nhiều thứ vẫn đang ở giai đoạn xác định. Ví dụ: "Sản phẩm này thực sự là gì" vẫn chưa định rõ. Lúc đó, Claude.ai không có Projects, không có Artifacts, cơ bản chỉ là một loạt cuộc trò chuyện giữa bạn và Claude, không có gì thêm vào gần như.

Vì vậy, cảm giác gia nhập Anthropic vào thời điểm đó, rất giống như gia nhập một công ty khởi nghiệp đang tìm kiếm hình dạng sản phẩm. Tất nhiên, nó đã có sự hỗ trợ tốt.

Alex Heath: Khi bạn gia nhập, dòng sản phẩm Claude 3 đã được phát hành, phải không? Bao gồm Opus, Sonnet và Haiku.

Mike Krieger: Đúng vậy. Đó là lần đầu tiên Anthropic giới thiệu một loạt mô hình gần với mức đầu ngành nhất. Lúc đó còn nhiều việc cần phải làm ở mức sản phẩm: Sản phẩm này sẽ trở thành cái gì?

Mặc dù lý lịch của tôi hơi thiên về sản phẩm tiêu dùng, nhưng lý do tôi rất phấn khích là vì trong khoảng thời gian từ Instagram đến Anthropic, tôi và người sáng lập đồng Instagram Kevin đã đầu tư rất nhiều. Chúng tôi có một loạt chủ đề đầu tư, trong đó một trong số đó là "Tương lai của công việc" - công việc trong tương lai sẽ được thực hiện như thế nào.

Và Anthropic dường như rất có khả năng mở khóa chủ đề này: Khi bạn có một trợ lý rất thông minh giúp bạn làm việc, điều gì sẽ xảy ra? Lúc đó, tôi thậm chí không thấy trước được rằng điều này sẽ trở thành điều có tính chất đột phá đến vậy.

Alex Heath: Bạn có thể đã nghĩ lúc đó: Đây là một công ty AI nhỏ khá thú vị, có thể giúp tôi hiểu sâu hơn về một số chủ đề đầu tư.

Mike Krieger: Đúng, có thể sẽ giúp chúng ta hiểu rõ hơn về một số chủ đề đang được suy nghĩ. Nhưng thực tế, những thay đổi mà nó mang lại nhiều hơn rất nhiều so với những gì tôi tưởng.

Đó là giai đoạn đầu tiên: đội ngũ rất nhỏ, dự án đang thực hiện có thể đếm trên đầu ngón tay. Sau đó chúng tôi nhảy về cuối năm ngoái, đội ngũ sản phẩm đã có một vài trăm người. Chúng tôi có một danh mục dự án đầy đủ, nhiều công việc bắt đầu trở thành triển khai, hiểu rõ nhu cầu của khách hàng, tập trung vào khách hàng, cấp quản lý, và tất cả những điều tất yếu xuất hiện khi công ty phát triển.

Dần dần, tôi nhận ra rằng có một số người rất thích công việc loại này, và họ rất giỏi. Tôi rất tôn trọng họ. Nhưng đối với tôi, tôi có một HLV tốt, cô ấy gọi trạng thái này là "Vùng Năng lực" — đó là việc bạn giỏi, làm tốt, và bạn có thể đảm nhận được, nhưng đó không phải là điều cuối cùng thực sự làm cháy bỏng bạn, thúc đẩy bạn.

Điều này thực sự là một vị trí nguy hiểm. Bởi vì bạn có thể làm trên vị trí này rất lâu và lâu, và dường như làm tốt, nhưng đó không phải là nơi bạn cháy bùng nhất, nhiều nhất động lực nhất.

Vì vậy, vào quý IV năm ngoái, tôi bắt đầu thảo luận vấn đề này với Daniela. Tôi nói, công ty đã phát triển lớn. Chúng tôi thực sự đã nén quá trình phát triển thông thường mất năm năm để hoàn thành. Mặc dù thực tế chỉ khoảng hai năm.

Alex Heath: Đúng, tôi nghĩ bạn đã phát triển khá tốt.

Mike Krieger: Đúng, tăng trưởng cũng không tồi. Quy mô đội ngũ, danh mục sản phẩm mở rộng nhanh chóng. Và tôi nói, tôi cảm thấy mình muốn đi và làm một công ty mới.

Daniela hỏi tôi: Điều này là vì bạn muốn rời khỏi Anthropic, hay vì bạn muốn điều chỉnh những gì bạn đang làm trong công ty? Tôi nói, tôi thực sự rất thích công ty này. Mọi người ở đây đều tuyệt vời, tôi cũng rất thích công nghệ này, sứ mệnh v.v.

Ngay lúc đó, chúng tôi cũng đang khởi động lại Labs. Bởi vì Labs v1 quá thành công, tất cả các dự án đều đã tốt nghiệp, không ai ở lại cuối cùng. Vì vậy Labs thực sự đã được tạm thời gập lại, đặt sang một bên.

Vì vậy, chúng tôi quyết định khởi động lại Labs, và tôi lại trở về vị trí của người xây dựng. Tất cả mọi người cả trong và ngoài công việc khi nhìn thấy tôi đều nói: "Mike, bạn trông có vẻ quá hạnh phúc."

Alex Heath: Một số đồng nghiệp của bạn cũng nói với tôi trước đây hôm nay. Họ nói, Mike hiện đang ở trạng thái tuyệt vời, sống rất hạnh phúc.

Mike Krieger: Vâng. Tất nhiên, tôi vẫn là người tự phê bình nghiêm khắc nhất của bản thân. Vì vậy, mỗi ngày tôi đều tự hỏi: Làm sao tôi có thể làm tốt hơn? Chúng ta có thể làm gì? Chúng ta có thể xây dựng gì? Cuối cùng, chúng ta đang xác minh điều gì?

Do đó, điều này không phải là chuyện dễ dàng. Nhưng đó thực sự là những thứ thúc đẩy tôi thực sự.

Alex Heath: Chúng ta không cần phải dừng lại quá lâu ở vấn đề này, nhưng tôi thực sự mê mải với việc các công ty công nghệ intern làm thí nghiệm "lên mặt trăng" từ 0 đến 1 như vậy. Alphabet có lẽ là một ví dụ điển hình, nhưng các nỗ lực tương tự trong lịch sử công nghệ thực sự rất nhiều. Một số thành công, một số không.

Lab của Anthropic v1, ít nhất từ kết quả sản phẩm, rõ ràng đã thành công.

Mike Krieger: Vâng.

Mục tiêu: Tìm Claude Code tiếp theo

Alex Heath: Tôi nghĩ điều này cũng đang tạo áp lực lớn đối với bạn. Bởi vì bạn sẽ nghĩ: Được rồi, Claude Code đã ở đó, tôi phải tạo ra một cái gì đó cạnh tranh được với nó.

Mike Krieger: Vâng. Điều thú vị là, bên trong chúng tôi có một tuyên bố sứ mệnh tương tự: Chúng tôi cần tìm ra Claude Code tiếp theo.

Khi Lab v2 bắt đầu, tiêu chuẩn này đã rất cao. Nhưng từ đó, Claude Code tiếp tục phát triển, vì vậy mức ngưỡng này đã cao hơn.

Tôi nghĩ có một số điều quan trọng. Đối với tôi, có kinh nghiệm khởi nghiệp rất hữu ích, vì bạn không bao giờ có thể hoàn toàn sao chép cảm giác đó: hai ba người đối đầu với toàn cầu, chỉ có một số tiền nhất định trong tay. Nếu chúng tôi không thể tạo ra một điều gì đó khả thi, chúng tôi sẽ phải đóng cửa công ty, trả tiền cho các nhà đầu tư.

Alex Heath: Điều đó giống như khi bạn và Kevin làm như vậy vào năm đó.

Mike Krieger: Hoàn toàn giống vậy. Tôi nhớ mỗi ngày đều cảm thấy áp lực sinh tử đó đè nặng lên tôi: Nếu việc này không thành công sẽ thế nào? Liệu tôi có thể tiếp tục giữ được tính độc lập này không? Liệu tôi có thể tiếp tục làm những điều thực sự quan tâm không?

Cam giác đó khó có thể tạo ra được trong một công ty lớn, trừ khi bạn thiết kế một số cấu trúc rất phức tạp. Tôi đã thấy cách làm đó. Trước khi khởi động Lab v2, tôi đã nghiên cứu nhiều trường hợp về các lab nội bộ của công ty. Một số công ty sẽ cho phép các nhóm có một phần cổ phần của những gì họ tạo ra, hoặc thiết kế các cơ chế khuyến khích tương tự khác.

Alex Heath: Vâng, đó là mọi loại sắp xếp "hàn lấp".

Dự án Thử Nghiệm Hai Tuần Một Vòng

Mike Krieger: Đúng vậy, chúng đều đang cố gắng hàn lấp cảm giác đó.

Nhưng chúng tôi nhận thấy rằng cách hiệu quả thực sự không hoàn toàn nằm ở cơ chế khích lệ. Bởi vì Anthropic chính thu hút nhiều người rất chủ động, có tham vọng, đồng thời mang theo tinh thần sứ mệnh. Điều chúng ta cần phải cẩn trọng hơn không phải là mọi người có động lực để hoàn thành dự án hay không, mà là cách tránh cho nơi đây trở thành một nơi thoải mái, nơi mà một số ý tưởng "có thể được" bị kéo dài hàng tháng.

Vì vậy, cách tiếp cận của chúng tôi là rút ngắn chu kỳ. Labs v1 cơ bản là một cuộc đánh giá mỗi bốn đến sáu tuần, một dự án sẽ nhận được sự hỗ trợ, sau đó đội ngũ sẽ có khoảng sáu tuần để chứng minh một số điều.

Hiện tại chúng tôi đang sử dụng sprint hai tuần. Mỗi hai tuần, mỗi dự án đều phải báo cáo cho toàn bộ nhóm lãnh đạo Labs. Đây không phải là cuộc họp kiểu "hội đồng giết", thường thì đó là cuộc trao đổi khá lý trí, trừ trường hợp một dự án thực sự lạc hướng.

Nhưng chúng tôi sẽ rất nghiêm túc hỏi mỗi dự án một câu hỏi: Trong hai tuần qua, bạn đã học được điều gì? Và: Số lượng kiến thức chúng ta học được đã đủ chưa?

Đôi khi, một dự án đã hoàn thành những gì cần hoàn thành. Bạn sẽ nói rằng, dự án này tuyệt vời, nó đã chứng minh những gì cần chứng minh, thực tế chúng ta không cần phải dành thêm hai tuần nữa.

Hiện tại việc thay đổi diễn ra quá nhanh, và với sự hỗ trợ các mô hình này, tốc độ xây dựng cũng rất nhanh. Vì vậy, việc để một dự án kéo dài thêm bốn tuần có chi phí cơ hội thực sự cao.

Tôi nghĩ đây là điểm mạnh nhất của Labs v2: chúng tôi đã quay bánh xe nhanh hơn. Ít nhất mỗi hai tuần, chúng tôi sẽ đánh giá mức độ học tập của mình một lần, ngay cả khi chưa thể đo lường tác động bên ngoài.

Alex Heath: Hầu hết mọi người trong Labs, đều là các cựu nhà sáng lập phải không?

Mike Krieger: Thực sự rất nhiều người là cựu nhà sáng lập.

Alex Heath: Điều này là tiêu chí của bạn khi lựa chọn người chơi không?

Mike Krieger: Trong Labs, chúng ta có khoảng hai loại vai trò. Chúng tôi gọi tất cả các dự án đều là cược, bởi vì chúng vốn là một loại đặt cược rủi ro cao, biến động cao. Và sau đó có bet leads, tức là người chịu trách nhiệm dự án.

Nếu bạn là người chịu trách nhiệm trực tiếp ở mặt tinh thần, cụ thể là DRI (Directly Responsible Individual), những người như vậy hầu hết đều có nguồn gốc là người sáng lập.

Nhưng Labs cũng có các thành viên khác. Họ có thể không phải là người sáng lập, mà là những người rất giỏi trong việc thực hiện. Ví dụ, có người trước đây là nhân viên sớm của một công ty startup, trải qua quá trình từ 0 đến 1; hoặc đơn giản là người rất thích xây dựng.

Chúng tôi có một đồng nghiệp tham gia Labs, cô ấy trước đó đã tham gia rất sớm vào một công ty startup trước đó, sau đó lại gia nhập Labs cũng rất sớm. Cô ấy có khả năng "Tôi có thể bao phủ toàn bộ ngăn xếp công nghệ, nơi nào cần tôi sẽ đi đến nơi đó".

Tôi nghĩ khả năng này không kém phần quan trọng như nguồn gốc là người sáng lập. Bạn không thể chỉ có người sáng lập thuần túy, bạn cần cả một "tính cách đội ngũ sáng lập" bổ sung.

Hình thức công ty trong tương lai: Nhóm nhỏ + AI

Alex Heath: Đồng chủ trì của tôi, Ellis, không thể tham dự hôm nay, nhưng anh ấy đã gửi cho tôi một số câu hỏi để tôi hỏi bạn. Một trong những câu hỏi đó là: Nhóm "siêu sáng lập" mà bạn đã xây dựng trong Labs, có phải là một mô hình tổ chức mới của công ty? Đặc biệt là trong thời đại AI. Hay đơn giản, điều này chỉ là trường hợp đặc biệt của công ty như Anthropic?

Mike Krieger: Đó là một câu hỏi rất hay.

Tôi nghĩ trong tương lai sẽ có nhiều nhóm như vậy hơn: một nhóm nhỏ, làm việc cùng mô hình. Mô hình không hoàn hảo, vì vậy bạn vẫn cần có những nhà sáng lập có khả năng đánh giá, có gu thẩm mỹ, có hướng dẫn.

Ví dụ, hôm qua tôi đã bỏ ra khoảng hai giờ, thảo luận với nhóm về một dự án Labs mà tôi đang làm. Trong dự án đó, chúng tôi đã thảo luận về trạng thái Multiplayer của sản phẩm, nghĩa là hình thái hợp tác đa người sẽ thế nào.

Ở đó, hai giờ đó rất có giá trị, cũng như rất "con người". Chúng tôi chỉ là ở trong một phòng, liên tục va chạm, thảo luận. Sau đó, trong khoảng 12 giờ tiếp theo, tôi đã nhờ Claude xử lý những ý tưởng đó một cách không đồng bộ.

Nhưng điều quan trọng là, bạn cần có người có khả năng đánh giá: vấn đề nào cần thảo luận kỹ từ đầu? Điều gì cần phải thực hiện trực tiếp? Vì nếu bạn không làm rõ, mô hình sẽ làm nhiều quyết định thay bạn.

Vì vậy, tôi nghĩ những nhà sáng lập vẫn đóng vai trò rất quan trọng. Nhưng một khi bạn đã đặt cấu trúc đúng, bạn có thể làm nhiều việc.

Tôi vừa thực hiện một buổi tổng kết nhỏ, xem xét những gì Labs đã làm trong vài tháng vừa qua. Thực ra mới chỉ có bốn tháng, nhưng một số dự án đã được lên ý tưởng vào tháng Một, vào tháng Hai đã bắt đầu thử nghiệm, vào tháng Ba đã hoàn thành; cũng có một số dự án được lên ý tưởng vào tháng Hai, hiện giờ đã trở thành Thiết Kế Claude.

Vì vậy đã xảy ra rất nhiều việc, với một tốc độ rất rất nhanh.

Tôi nghĩ, trong tương lai sẽ có nhiều công ty chuyển sang mô hình này: đội ngũ nhỏ hơn, đưa quyền tự quản lý cho họ, để một người thực sự có trách nhiệm đẩy mạnh dự án, và ban đầu không nên chỉ định quá nhiều người.

Đây là một điểm rất quan trọng mà chúng tôi học được trong Labs v2: Đừng ngay lập tức chỉ định năm người cho một dự án. Nên bắt đầu từ hai ba người trước, giống như một công ty khởi nghiệp.

Alex Heath: Tiếp theo là phần tôi yêu thích nhất: Tôi sẽ cố gắng lấy thêm thông tin về các dự án từ bạn.

Vào tháng Ba năm nay khi chúng ta gặp nhau, bạn nói với tôi rằng, bạn đang nghiên cứu vấn đề để Claude có thể hoạt động trong thời gian dài hơn, cụ thể là vấn đề long-horizon, để nó có thể xử lý các nhiệm vụ trong chu kỳ dài hơn. Lúc đó bạn đang phụ trách dự án đó. Bạn có đang tiếp tục phụ trách nó không?

Mike Krieger: Không phải. Dự án này khá điển hình: Thực ra, chúng tôi đã để nó qua một bên, nhưng kết quả học tập của nó sau đó đã được đưa vào Kết quả trong Managed Agent hôm nay.

Ý tưởng cốt lõi của dự án này là, để Claude thực hiện một nhiệm vụ dựa trên rubric, tức là tiêu chuẩn đánh giá, để thực hiện một nhiệm vụ hướng đến kết quả hoặc mục tiêu cuối cùng, chứ không phải chỉ phản ứng với một prompt duy nhất. Điều này hoàn toàn phù hợp với hướng đi chúng tôi đã khám phá trước đó trong Labs.

Lúc đó, tôi cũng đang xem xét rằng dự án sau này sẽ mở rộng ra sao. Trong bản phát hành sáng nay, có hai chủ đề thực ra trực tiếp tạo ra từ dự án Labs này.

Một là Kết quả (Outcomes). Một là trong bài trình diễn của Boris, bạn đã thấy Claude Code sẽ xác minh công việc của mình thông qua ảnh chụp màn hình, kiểm tra những gì mình đã làm.

Đó cũng là một trong những hướng chúng tôi tập trung vào lúc đó. Bởi vì Claude nhìn vào đoạn code mình viết và nói "Tôi nghĩ không vấn đề gì", là một vấn đề; nhưng việc thực sự khám phá và xác minh hoàn toàn khác biệt.

Trong dự án mà tôi đang phụ trách, chúng tôi đã thậm chí nghiên cứu cách để Claude ghi âm quá trình hoàn thành công việc của mình, sau đó tự xem video để đánh giá: "Ồ, đoạn hoạt ảnh này không đúng". Một số vấn đề chỉ có thể phát hiện bằng ảnh chụp màn hình không thể thấy được.

Vì vậy, đúng vậy, vào tháng 3 chúng ta đã thảo luận về dự án đó, vào thời điểm đó nó đang trong quá trình phát triển. Bây giờ chúng tôi đã đặt nó qua một bên. Nó vẫn có thể chạy bên trong, đôi khi chúng tôi vẫn sử dụng nó cho một số trình diễn. Nhưng giá trị chính của nó là trở thành nguồn cảm hứng và xác minh khả năng lên dòng chảy.

Alex Heath: Dự án khác, vào thời điểm đó bạn nói để cho Claude tự chọn hình thái của chính mình. Ví dụ, nó sẽ tự đánh giá: cuộc trò chuyện tiếp theo, thay vì sử dụng giao diện dòng lệnh, thà biến thành một trang web.

Mike Krieger: Đúng.

Alex Heath: Vậy đó có phải là Claude Design không? Hay là thứ khác?

Mike Krieger: Nó có rất nhiều điểm tương tự với Claude Design về tinh thần, nhưng không phải là cùng một thứ.

Chúng tôi đang tiếp tục đặt câu hỏi là: Claude Design cơ bản là một hình thái của "agent + canvas". Bạn có thể tưởng tượng, có rất nhiều kết hợp như vậy.

Ngay cả bên trong Claude Design, tôi đã sử dụng nó cho nhiều việc. Ví dụ, viết tài liệu hợp đồng kỹ thuật. Hiện tại cách tôi thích nhất để viết tài liệu kỹ thuật, thực sự là sử dụng Claude Design. Bởi vì bạn có thể hình dung việc làm cho dòng thông tin trở nên trực quan: thông tin đó làm thế nào để chảy? Có thể chảy ra sao? Sau đó bạn có thể nhìn trực tiếp vào quá trình tiến hành nó.

Điều này có lẽ là trường hợp sử dụng yêu thích thứ hai của tôi. Số một là làm slides, hiện tại tôi thường xuyên sử dụng Claude Design để tạo slide. Nhưng bạn hoàn toàn có thể tưởng tượng, canvas còn có thể chứa các định dạng khác. Vì vậy đây là một hướng mà Labs đang khám phá: giống như Claude Design, nhưng hướng tới nhiều loại, nhiều tình huống ứng dụng hơn.

Tôi cảm thấy điều này rất là hứng khởi.

Alex Heath: Vậy nó cơ bản là phần mềm năng suất phổ quát hơn phải không? Đó có phải là ý tưởng cốt lõi không?

Mike Krieger: Tôi nghĩ rằng đây là một chủ đề mà có thể tiếp tục đào sâu để khám phá: một loại phần mềm năng suất, và tốt nhất là có thể cá nhân hóa cao, phù hợp với phần mềm năng suất của bạn. Tôi nghĩ rằng đây là một xu hướng rất thú vị.

Alex Heath: Bạn hiện đang suy nghĩ về lĩnh vực trống trơn nào trong trí tuệ nhân tạo hiện tại không?

Mike Krieger: Với việc mô hình liên tục cải tiến, tôi nghĩ rằng khả năng của chúng trở thành một đối tác hữu ích trong các lĩnh vực như khoa học sống sẽ rất thú vị.

Tôi gần đây đã thấy ngày càng nhiều ví dụ như vậy. Ví dụ, trên X có một thread rất tuyệt vời, có người tự mình thực hiện trình tự toàn bộ gen tại nhà. Sau đó, anh ta thậm chí đã chuyên nghiệp hóa việc này, và bây giờ anh ta có thể đến nhà bạn để thực hiện.

Tôi rất quan tâm đến điều này, bởi vì tôi là người thích tự nhận biết, muốn hiểu rõ cách làm những điều này.

Một số người thực sự hiểu về lĩnh vực này đã nói với tôi rằng, có sự khác biệt lớn giữa mô hình vài tháng trước và mô hình như Opus 4.7 hiện nay. Bây giờ các mô hình đã thực sự hữu ích trong việc phân tích dữ liệu gen, tìm ra các suy luận từ đó, hoặc đọc kết quả xét nghiệm của bạn.

Trước đây có thể chỉ là "ơ, dễ thương, nó nói điều mà một bác sĩ đã nhìn thấy cũng sẽ nói" hoặc chỉ là lặp lại một số điều chúng ta đã biết dựa trên các quy tắc kinh nghiệm. Nhưng bây giờ nó thực sự bắt đầu có giá trị.

Vì vậy, y học cá nhân là một trong những lĩnh vực trống trải mà tôi rất quan tâm. Tôi cảm thấy chúng ta đang đứng trên một ranh giới. Vẫn còn rất nhiều điểm "overhang" ở đây, có nghĩa là đã có thể thực hiện công nghệ ngày nay, nhưng sản phẩm và ứng dụng vẫn chưa được phát huy đầy đủ.

Alex Heath: Hiện nay thực sự có nhiều công ty khởi nghiệp tương tự nổi lên, như Superhuman, Superpower, Ro, cũng như Function Health, đều đang làm những điều tương tự.

Mike Krieger: Đúng vậy. Tháng 1 năm nay, khi chúng tôi đang khám phá sơ bộ Claude for Healthcare, một trong những đối tác đã hợp tác là Function. Bạn có thể nhập kết quả xét nghiệm của mình vào Claude, sau đó thực hiện phân tích chi tiết hơn.

Trong tuần này, tôi cũng bắt đầu sử dụng dịch vụ bổ sung mang tên Subco. Bạn nhập tất cả các loại bổ sung bạn đã uống vào đó, nó sẽ biết cách các bổ sung này tương tác với nhau, sau đó đưa ra khuyến nghị cho bạn, ví dụ: thực ra bạn không cần phải uống tám loại này, bạn có thể giảm xuống còn bốn loại.

Bước tiếp theo họ chưa thực hiện, nhưng tôi có thể tưởng tượng một ai đó sẽ thực hiện: kết hợp kết quả xét nghiệm gần đây nhất của bạn, hoặc kết hợp dữ liệu gen của bạn, nó có thể xác định xem bạn có phản ứng cực mạnh với một loại bổ sung nào đó hay không.

Vì vậy, cả lĩnh vực này thực sự rất thú vị. Điều đó vẫn chỉ là một phần của việc "tối ưu hóa". Nếu ta nghĩ tới những lĩnh vực mà hệ thống y tế ngày nay vẫn chưa đáp ứng đủ, ví dụ như nhiều người không có nguồn tài nguyên y tế chất lượng địa phương, thì AI có thể một phần nào đó bù đắp cho những khoảng trống đó.

Vì vậy, có rất nhiều không gian trống thú vị ở đây.

Mike Krieger: Một lĩnh vực khác cũng rất thú vị. Khoảng một năm trước, tôi tham gia một hội nghị AI tiêu dùng do tổ chức Forerunner tổ chức. Lúc đó, trên sân khấu, tôi đã thảo luận với một số nhà sáng lập về: Ngoài việc trò chuyện, trợ lý vô tận, ứng dụng nổi bật của AI tiêu dùng, tức là ứng dụng thực sự đột phá, sẽ là gì?

Đến nay, tôi vẫn chưa thực sự thấy nó. Có lẽ sức khỏe có thể được tính, nhưng nó không hoàn toàn phù hợp với loại ứng dụng tiêu dùng mà tôi vừa mô tả. Sản phẩm hẹn hò dựa trên AI có thể có một ít cơ hội, nhưng bên trong có một chút cảm giác khó chịu tự nhiên.

Alex Heath: Vậy nên liệu chúng ta có thể thấy Claude làm một dịch vụ hẹn hò?

Mike Krieger: Tôi nghĩ chúng tôi sẽ không tạo Dịch vụ Hẹn hò Claude. Nhưng có lẽ một khách hàng nào đó dựa trên API của Claude sẽ tạo ra một sản phẩm tương tự. Tôi không nghĩ rằng chúng tôi sẽ tạo nó bên trong.

Tuy nhiên, tôi vẫn nghĩ rằng có một vấn đề trống lặng thú vị ở đây: liệu AI có thực sự giúp chúng ta hiểu bản thân hơn, hiểu thế giới hơn, hiểu cộng đồng hơn và kết nối con người với nhau hơn, thay vì làm cho chúng xa cách hơn?

Ví dụ, gần đây tôi bắt đầu quan tâm đến sự tham gia của công dân: làm thế nào để tổ chức một nhóm người đại diện, thảo luận vấn đề công cộng. Tôi không phải là chuyên gia trong lĩnh vực này, nhưng tôi đã bắt đầu quan tâm đến vấn đề này.

Trong tình huống này, vai trò của AI không phải là thay thế con người trong việc quyết định, mà là giúp tìm ra nhóm người đại diện. Nghĩa là, giữ cho con người tham gia trong quá trình, nhưng đảm bảo những giọng nói chính xác mà chúng ta nghe là đúng.

Alex Heath: Tôi rất tò mò, bây giờ bạn còn có "bản năng" của "sản phẩm truyền thông xã hội" không?

Mike Krieger: Có lẽ không còn mạnh mẽ như trước. Tuy nhiên, nếu nói về hướng đi này còn ý tưởng gì thú vị, tôi nghĩ rằng Sora đã từng khám phá một điểm khá thú vị: bạn có thể mô tả thuật toán bạn muốn, sau đó hệ thống sẽ tạo ra nó cho bạn.

Alex Heath: Hướng này hiện đang xuất hiện khắp nơi. Threads có, X cũng có một phần. Tôi nghĩ rằng điều này sẽ trở thành một khả năng tiêu chuẩn.

Mike Krieger: Spotify cũng có. Tôi đã từng sử dụng trên Spotify. Tôi đã tạo một số danh sách phát rất "ngoại lệ". Ví dụ, con gái và tôi không thể đồng ý nghe gì, chúng tôi sẽ yêu cầu Spotify tạo ra một danh sách phát, lấy phần giao nhau của sở thích của chúng tôi. Kết quả cuối cùng có thể là Pavement cộng với nhạc phim "Frozen". Rất tuyệt.

Alex Heath：Tôi thích điều này. Rất thú vị.

Mike Krieger：AI DJ của Spotify thực sự rất sáng tạo. Nhưng tôi nghĩ, đó là một cách mà AI đang giúp chúng ta cá nhân hóa bản thân.

Gần đây tôi cũng đã nghĩ đến một điểm khác. Tôi không chắc rằng đó có phải là một dự án phù hợp cho Labs, nhưng có lẽ một ai đó nên thử: liệu AI có thể trở thành một bộ lọc hữu ích, loại bỏ tiếng ồn từ thế giới bên ngoài?

Tôi gần đây đã bắt đầu sử dụng Dispatch và Co-work, vì cũng vì lý do đó. Nếu không tôi sẽ trở thành một nghiện tin tức không cứu chữa. Tôi sẽ liên tục kiểm tra mọi trang tin tức, đọc rất nhiều thứ. Điều này tất nhiên có giá trị, nhưng đôi khi tôi cũng tự hỏi: Liệu tôi có phải luôn đọc lại cùng một câu chuyện không?

Vì vậy, hiện tại, tôi có một thứ giống như bản tin hàng ngày, được đặt trong quy trình làm việc trước đó của tôi. Nó sẽ tổng hợp các nguồn thông tin mà thường xem của tôi. Rất nhiều lần tôi vẫn click vào xem nguồn gốc, nhưng nó ít nhất cũng giúp tôi nhận biết xu hướng là gì, giúp tôi không cần phải mở mười hai trang web hàng sáng.

Alex Heath：Chỉ cần bạn vẫn đọc bản tin từ The Verge, Mike, bạn có thể tiếp tục tổng hợp như trước.

Mike Krieger：Dĩ nhiên, đó chắc chắn sẽ đi trực tiếp vào hộp thư đến của tôi.

Alex Heath：Tôi nhớ trước đây đã thấy một điều bí mật trên X, không biết thật hay giả, nói rằng bạn đang xem xét việc thực hiện một số thứ nâng cao hơn. Có thể gọi là Orbit gì đó? Có thể sẽ nâng cao hơn đưa những điều mà bạn vừa nói vào Co-work, hoặc một phần giao diện khác, hướng đến người dùng tiêu dùng hơn.

Bạn nghĩ đó có phải là một cơ hội không?

Mike Krieger：Tôi nghĩ đúng vậy. Bất cứ khi nào bạn thấy người dùng chuyên sâu tạo ra những kịch bản sử dụng như vậy, luôn tự nhiên nảy sinh một câu hỏi: Nếu biến những khả năng như vậy thành tính năng tích hợp, nó sẽ như thế nào?

Ví dụ như bản tin hàng ngày định kỳ, hoặc theo dõi một số thứ một cách chủ động. Chúng tôi bên trong Anthropic rất phụ thuộc vào Slack, vì vậy nó có thể theo dõi Slack một cách tự động; cũng có thể theo dõi email.

Gần đây tôi cũng bắt đầu làm như vậy. Bước vào rạp sáng của tôi có một số thứ. Một trong số đó là bản tin, như đã nói. Một cái khác là để nó quét Superhuman, đó là ứng dụng email cá nhân của tôi. Vì MCP đã được phát hành, nó giờ có thể quét email của tôi.

Điều này rất hữu ích vì nó biết về các loại thư khác nhau, có thể cho tôi biết: đây là thư mà bạn thực sự nên đọc; những thứ này bạn có thể đọc sau. Vì vậy, trước khi mở hộp thư đến, tôi sẽ xem bản tóm tắt mà Claude gửi cho tôi.

Còn có một số vấn đề liên quan đến mua sắm. Ví dụ, nếu tôi đang đợi một món đồ nào đó được bày bán, thay vì phải kiểm tra mỗi sáng một lần, tôi có thể nhờ Claude xem giúp.

Alex Heath: Điều này liên quan đến việc tranh giành giày không?

Mike Krieger: Tôi nên dùng nó để tranh giành giày. Nhưng có lẽ nó vẫn chưa đủ nhanh, việc tranh giành giày cần một hệ thống nhanh hơn.

Còn rất nhiều hố thông tin trên Internet, đó là những hang động thông tin mà bạn dễ dàng rơi vào. Tất nhiên, có một sự cân bằng ở đây: bạn không muốn hoàn toàn loại bỏ niềm vui đó. Đôi khi lạc lối trên Internet cũng khá thú vị. Nhưng có lẽ bạn có thể làm điều đó một cách có ý thức hơn, thay vì vô tình lướt qua lướt lại ở nền.

Từ Claude Code đến Co-work, Sản phẩm AI bắt đầu phục vụ người không phải là lập trình viên

Alex Heath: Tôi là người dùng của Co-work, sử dụng mỗi ngày. Tôi thậm chí đã sử dụng nó để chuẩn bị cho cuộc phỏng vấn lần này, viết và gần như làm mọi thứ bằng nó. Đối với tôi, nó đã thay đổi cách làm việc một chút. Tôi đã giới thiệu nó cho vợ và bạn bè của mình. Nhưng tôi thực sự cảm thấy rằng nó vẫn còn sớm. Đa số mọi người có lẽ chưa sử dụng nó như tôi. Từ góc độ sản phẩm, Co-work hiện tại vẫn có sự phân cách so với trò chuyện truyền thống và Claude Code. Tôi không nghĩ rằng trong tương lai dài hạn chúng sẽ là ba thứ khác nhau.

Mike Krieger: Tôi đồng ý.

Alex Heath: Vài tháng trước khi tôi đến văn phòng của bạn, một số đồng nghiệp của bạn cũng nói rằng, có lẽ Cuối cùng, Co-work sẽ trở thành giao diện trước hết của mọi thứ.

Co-work là một dự án của Labs mà bạn đã tham gia trước khi trở thành Labs, phải không? Nhưng khi nó được phát hành, bạn vẫn là CPO. Vì vậy, tôi rất tò mò, lúc bắt đầu phát triển Co-work, bạn đã có nhận thức gì? Liệu rằng bạn bất ngờ nhận ra: việc trừu tượng hóa khả năng lập trình, để người thông thường cũng có thể sử dụng, có phải là cơ hội? Hay có lý do khác không?

Mike Krieger: Ở đây, tôi muốn khen ngợi Dario.

Anthropic luôn cùng một lúc suy nghĩ về nhiều điều khác nhau: nghiên cứu, sản phẩm, kinh doanh, sức mạnh tính toán, chính sách, tác động xã hội v.v. Nó không phải là một công ty điển hình, không chỉ có sản phẩm và hai vấn đề quan trọng nhất là tiếp thị. Sự chú ý của CEO chủ yếu được tập trung vào đó.

Sự chú ý của Dario sẽ chuyển đổi giữa các lĩnh vực khác nhau tùy theo vấn đề cấp bách nhất vào lúc đó. Ngay trước khi Co-work được phát hành, anh ấy nói với chúng tôi: "Gần đây tôi đã thấy một xu hướng rất thú vị, một số người đang sử dụng Claude Code cho các tình huống cá nhân. Nhưng với đa số mọi người, điều này khó khăn vì bạn phải mở cửa sổ terminal, trong khi terminal chính nó đã có rào cản rất cao."

Vì vậy, anh ấy đặt ra một câu hỏi: Nếu chúng ta tạo ra một "Claude Code dành cho mọi lĩnh vực khác", điều đó sẽ như thế nào? Điều này là một cảm hứng rất hữu ích và phản ánh rất đúng cách anh ấy làm việc. Anh ấy không vẽ ra một bản phác thảo sản phẩm cho bạn, cũng không xác định rõ ràng sản phẩm đó.

Alex Heath: Đó là vấn đề của bạn bây giờ.

Mike Krieger: Đúng. Anh ấy chỉ nói: "Đây là một vấn đề về sản phẩm, các bạn hãy giải quyết." Sau đó, điều thực sự đưa Co-work trở nên hình thành là sự kết hợp của hai loại cá nhân. Tất nhiên, có nhiều người tham gia, nhưng tôi đặc biệt nghĩ đến hai người.

Một người là Felix, người dẫn đầu trong việc duy trì Electron, am hiểu rất rõ về phần mềm máy tính để bàn, hoặc ít nhất là hiểu biết sâu về phần mềm Web dành cho máy tính. Anh ấy luôn suy nghĩ về một vấn đề: Làm thế nào để cho người khác hoàn thành công việc trên máy tính của họ? Người kia là Boris, người hiểu rõ về Claude Code.

Khi chúng tôi đưa họ cùng đội của họ lại gần nhau, chỉ sau vài tuần, chúng tôi đã có thể phát hành Co-work. Không phải vì tất cả công việc diễn ra trong vài tuần đó, mà vì trước đó đã tích lũy rất nhiều suy nghĩ về mặt Claude Code và phần mềm máy tính để bàn: Làm thế nào để cho không chỉ lập trình viên, mà mọi người cũng có thể sử dụng khả năng này?

Vì những mô hình này vốn đã là những bộ não rất mạnh mẽ, cũng là những trí thức thông minh có khả năng tự hành động. Vấn đề là, làm thế nào để đưa bộ não này đến với nhiều người hơn.

Nhưng tôi hoàn toàn đồng ý với đánh giá của bạn: Hiện tại, cảm giác mà nó mang lại cho mọi người hơi giống như chúng ta không phải đang phát hành biểu đồ tổ chức, mà là đang phát hành chiến lược kết nối, hoặc nói cách khác là chiến lược khung thức kiểm thử và chạy thử nghiệm. Điều này không dễ hiểu đối với đa số người dùng.

Alex Heath: Và nó cũng là trải nghiệm sản phẩm không tốt. Ví dụ, luồng công việc của tôi trong Co-work không đồng bộ với ứng dụng di động Claude. Nghĩa là, tôi không thể mang tài liệu phỏng vấn mà tôi đã chuẩn bị trong Co-work sang điện thoại di động.

Mike Krieger: Đúng. Một số sản phẩm tự nhiên sẽ chỉ ra hướng phát triển tiếp theo của nó.

Ví dụ, tôi là người dùng nhiều của Dispatch. Dispatch cho phép bạn truy cập từ xa vào Co-work, nhưng điều kiện tiên quyết là máy tính của bạn phải bật. Vì vậy, một câu hỏi tiếp theo rất tự nhiên là: Nếu tôi không cần phải để máy tính luôn bật, thì thật tuyệt vời. Vậy chúng ta sẽ phát triển theo hướng nào?

Claude Code đã đi trước trên con đường này, chỉ là sớm hơn khoảng nửa năm đến một năm. Ví dụ, Claude Code Remote, tôi luôn sử dụng. Khi tôi ở bên ngoài, tôi cũng có thể bắt đầu một nhiệm vụ lập trình. Rất nhiều lần, khi tôi quay trở lại trước màn hình máy tính, nó đã tự động submit một pull request.

Bạn có thể tưởng tượng, Co-work cũng sẽ có hướng phát triển tương tự.

Nhưng tôi đồng ý, hiện tại chúng ta thực sự đang ở giai đoạn: để đổi mới, chúng ta đã để nhiều thứ phát triển tự nhiên trước tiên. Điều này tất nhiên rất tốt. Nhưng tiếp theo, từ quan điểm ngữ cảnh và liên tục, liệu bạn đang nói chuyện ở đâu, hay ở đâu không nên là vấn đề mà người dùng cần suy nghĩ.

Vợ tôi thường hỏi: Tôi đã quên rồi, điều đó có phải là tôi đã làm trong coding không? Hay đã hỏi trong chat không? Hay đã làm trong Co-work không? Điều này chỉ ra rằng tầng trừu tượng là không tốt, chúng ta cần sửa chữa nó.

Alex Heath: Thực ra điều này rất hợp lý. Vì khi tôi trao đổi với nhóm OpenAI, chiến lược ứng dụng siêu của họ hiện tại, cũng như hướng họ tiến về Codex, thực tế là một dạng cuối cùng mà bạn đã tạo ra bằng Co-work ban đầu.

Tôi rất tò mò, thứ nhất, bạn nghĩ sao về hướng đi của ứng dụng "siêu" như vậy đối với sản phẩm AI? Thứ hai, điều này có tạo thêm áp lực cho bạn không? Bởi vì tôi cảm thấy OpenAI đã nhận ra, đó là một cơ hội lớn: mang khả năng lập trình đến với những người không biết code.

Mike Krieger: Đúng, và họ tiến triển rất nhanh.

Alex Heath: Codex cũng rất tuyệt, mô hình mới cũng rất tốt, Codex đang phát triển rất tốt đối với họ.

Claude trước đây đã có một sự tăng trưởng lớn trong lập trình, và bên ngoài vẫn đánh giá cao rằng Claude đang dẫn đầu về khả năng lập trình. Nhưng thật sự, Codex đang theo sau sát sao, phải không?

Mike Krieger: Vâng, nó thực sự đã mạnh mẽ lên.

Trong một số thời điểm thú vị nhất của Instagram, lại chính là khi chúng tôi đối mặt với các đối thủ như Snap. Họ và chúng tôi đều hoạt động trong cùng một không gian, nhưng lại có phương pháp khác nhau. Trong một thị trường phát triển nhanh chóng, bạn sẽ nhận ra rằng một số ý tưởng bạn học hỏi từ đối phương, trong khi một số ý tưởng lại là đối phương học hỏi từ bạn.

Alex Heath: Vì vậy, trong bối cảnh này, Anthropic có phải là Snap không?

Mike Krieger: Tôi cũng không biết ai là ai. Động lực của thị trường khác nhau, và giá trị thị trường cũng không giống nhau mấy.

Alex Heath: Vâng, có một chút khác biệt.

Mike Krieger: Nhưng cái tinh thần của công ty thực sự rất khác nhau.

Ít nhất ở hiểu biết của tôi vào thời điểm đó, không phải tất cả cạnh tranh cuối cùng đều sẽ phát triển theo cách đó, nhưng sự cạnh tranh giữa Instagram và Snap, đến một mức độ nào đó thực sự là như vậy: chúng ta đều có ưu điểm của riêng mình, và cũng có cái nhìn về tương lai tương tự nhưng không hoàn toàn giống nhau.

Vấn đề trở thành: Mỗi công ty làm thế nào để phát triển và đạt được những vị trí khác nhau đó?

Ví dụ với Instagram, ấn tượng mà chúng tôi đem lại trước đây là, mỗi tuần đăng một bức ảnh rất tinh tế. Chúng tôi muốn đi đến một nơi: để người dùng có thể chia sẻ tự do hơn. Và việc giới thiệu Stories, đối với chúng tôi, rất quan trọng.

Với Snap, họ cũng muốn sở hữu nhiều nội dung liên quan đến influencer và người nổi tiếng, vì phần nhu cầu đó đang tăng lên. Vì vậy cả hai đều phải quản lý con đường phát triển của mình.

Phân tích này có thể hơi rộng rãi. Nhưng trở lại với chúng tôi, có OpenAI trong không gian này thực sự rất thú vị. Tôi nghĩ điều quan trọng nhất với chúng tôi là hai điều.

Thứ nhất, là điều chúng tôi vừa thảo luận: là phải làm cho hệ thống sản phẩm của chúng tôi trở nên thống nhất hơn, logic hơn. Không nhất thiết phải là một ứng dụng duy nhất hoặc siêu ứng dụng, nhưng ít nhất các mô-đun xây dựng của bạn nên kết nối với nhau và khi đặt cùng nhau, phải có ý nghĩa.

Thứ hai, là tiếp tục thu nhỏ khoảng cách giữa khả năng và việc sử dụng. Bởi vì ngay cả ngày nay, dù là Co-work, hoặc bất kỳ sản phẩm nào của chúng tôi ngày nay, cũng vẫn tồn tại vấn đề này.

Ngay cả khi tôi vừa nói chuyện với một đồng nghiệp tuyển dụng của chúng tôi. Anh ấy là người dùng Co-work nặng nề nhất trong cơ quan, và cũng là người không phải là lập trình viên sử dụng Co-work nhiều nhất tại Anthropic. Nhìn vào quá trình làm việc của anh ấy, bạn sẽ cảm thấy rất ấn tượng.

Tuy nhiên, ngay cả tại Anthropic, hầu hết các thành viên trong nhóm tuyển dụng cũng không làm việc theo cách đó.

Vì vậy, dù cuối cùng hình dạng cuối cùng có phải là siêu ứng dụng hay không, mục tiêu vẫn là như nhau: Liệu chúng ta có thể tạo ra một dạng sản phẩm phù hợp, để kinh nghiệm của đồng nghiệp tuyển dụng này có thể lan truyền nhanh chóng, khiến cho người khác cũng dễ dàng áp dụng luồng làm việc tương tự? Hoặc để mỗi người đều có thể đạt được sự tự tin và điêu luyện như khi sử dụng Claude?

Alex Heath: Đầu tiên, hôm nay em đặc biệt hi vọng sẽ nghe thêm nhiều thông tin về Co-work. Mặc dù em biết đây là hội nghị dành cho nhà phát triển. Em rất tò mò, Co-work so với Claude Code phát triển như thế nào? Nó có phát triển nhanh hơn không? Có dữ liệu gì không?

Mike Krieger: Em không chắc về việc so với sản phẩm lập trình tổng thể, vì lĩnh vực lập trình chính đã phát triển rất rất nhanh. Nhưng quỹ đạo tăng trưởng của Co-work, ít nhất là tương đương với quỹ đạo của Claude Code vào thời điểm đó, thậm chí có vẻ nhanh hơn. Điều này thực sự rất là hứng thú.

Em cũng rất là hồi hộp, bởi vì em luôn mong muốn tầm ảnh hưởng của Claude có thể vượt ra ngoài tình huống mã nguồn sạch.

Bây giờ gần như mỗi vài ngày, ở trong một kênh Slack hướng đến sự hiệu quả lao động hơn bên trong, sẽ có người chia sẻ về mốc thời gian mới của Co-work. Sự tăng trưởng này thực sự làm nhiệt huyết cho chúng ta.

Khi chúng tôi trao đổi với các khách hàng doanh nghiệp, họ cũng nói: Tốt lắm, chúng tôi đã áp dụng Co-work, và sau đó cũng nhận thấy hiện tượng này—một số người thực sự hiểu nó, một số người cần rất nhiều sự trợ giúp từ cơ bản, cách các bộ phận sử dụng khác nhau.

Điều này là một câu hỏi tốt. Bởi nó chứng tỏ, trong những người phù hợp, trong tình huống phù hợp, dưới dạng sản phẩm phù hợp, sản phẩm này đã có thể làm việc. Nhưng vẫn còn khoảng cách ở giữa.

Em nghĩ, khi chúng ta có thể làm cho hầu hết mọi người không cần quá nhiều chi phí ban đầu, để đạt được trạng thái "Ôi, trí tuệ nhân tạo thực sự đang giúp tôi làm việc", sự tăng trưởng của nó sẽ tiếp tục gia tăng.

Alex Heath: Nói về cạnh tranh, chúng ta đã nói chuyện về một chủ đề khác khoảng một nửa năm trước trong một sự kiện: Cạnh tranh với khách hàng. Lúc đó anh cũng chưa phát hành sản phẩm Claude Code này.

Mike Krieger: Đúng.

Công ty mẫu bắt đầu làm ứng dụng

Alex Heath: Lúc đó chúng ta đã trò chuyện, với những khách hàng lớn như Cursor, nếu chính họ tạo ra một sản phẩm tương tự, thì sao? Khi đó anh với tư cách Giám đốc sản phẩm cần phải đưa ra quyết định. Bây giờ anh không còn là CPO nữa, có vẻ không cần phải đưa ra quyết định như vậy nữa.

Nhưng hiện tại tình hình thế nào? Thực ra, chúng ta đã thảo luận khá nhiều vấn đề này. Ví dụ như mâu thuẫn giữa Claude Design và Figma. Lúc đó bạn đang ở trong Hội đồng Figma, và vì vậy bạn đã rời khỏi. Sau đó, Dylan cũng nói một số lời rất thân thiện, dường như vụ việc không nhắm đến cá nhân bạn.

Nhưng vụ việc này đích thực là một ví dụ. Rất nhiều người trên thị trường khi nhìn thấy xu hướng hiện tại, họ sẽ nghĩ rằng: Ôi trời ơi, Anthropic dường như đang chuẩn bị bước vào mọi lĩnh vực chính quan trọng. Vụ việc với Figma dường như đặc biệt nhạy cảm.

Mike Krieger: Vụ này chắc chắn phức tạp hơn so với trước kia. Khi tôi mới gia nhập Anthropic, chúng ta chỉ có Claude.ai. Lúc đó, tôi thấy, điều này không giống như đang cạnh tranh với ai đó, mà nó giống như một dạng sản phẩm hoàn toàn mới.

Hiện tại, chúng tôi vẫn sẽ rất thận trọng, rất cẩn trọng khi suy nghĩ về việc phát triển các sản phẩm.

Tôi nghĩ rằng, chỉ khi chúng ta phát hành một sản phẩm có thể mang lại một giá trị độc đáo nào đó, vụ việc đó mới có ý nghĩa. Vì trên nền tảng Claude có rất nhiều khách hàng xuất sắc, cũng có rất nhiều người trong công ty rất chăm chỉ hỗ trợ khách hàng đó thành công.

Vì vậy câu hỏi đặt ra là: Liệu chúng ta có đang chỉ ra một hướng đi nào đó, để ngành công nghiệp nhìn thấy một khả năng? Lý tưởng nhất, đây sẽ là hiệu ứng thủy triều, khiến cho nhiều công ty bắt đầu áp dụng cách tiếp cận này.

Claude Code chính là một ví dụ tốt. Trước đây, sự chú ý tập trung nhiều hơn vào trình soạn thảo, chứ không phải là bảng điều khiển. Sau khi Claude Code được phát hành, đặc biệt là sau khi chúng tôi phát hành nó theo cách đó và tập trung nhiều vào nó, toàn bộ ngành công nghiệp đã bắt đầu chuyển hướng theo cách lớn mạnh đó. Tất nhiên, trước đó cũng có người đã suy nghĩ về tình huống bảng điều khiển.

Đó là hi vọng của tôi đối với những sản phẩm này. Không phải là họ sẽ trở thành duy nhất trong ngành của mình. Nếu như vậy, điều đó sẽ là rất tồi tệ. Tôi hy vọng có đa dạng sản phẩm tồn tại.

Tình huống lý tưởng hơn là: Thứ nhất, chúng ở trong danh mục sản phẩm của chúng ta mà có ý nghĩa. Ví dụ, nếu bạn đã kết nối tất cả MCP trong Claude.ai, thì điều đó sẽ làm cho các sản phẩm khác trở nên tốt hơn.

Thứ hai, chúng có thể chỉ ra một hướng tiến lên. Ví dụ, Claude Design, nó rất agent-first, nghĩa là rất nhấn mạnh vào việc khiến trí tuệ nhân tạo ưu tiên, và cung cấp cho agent nhiều không gian điều khiển đầu ra. Điều này sẽ mang lại một trải nghiệm sản phẩm cụ thể.

Đối với tôi, điều này rất hữu ích khi thực hiện các slides. Tôi có thể suy nghĩ cùng agent, đồng thời cũng cùng nó sản xuất nội dung.

Alex Heath: Anh không nghĩ rằng nó sẽ cạnh tranh với Figma ư?

Mike Krieger: Tôi nghĩ rằng chúng phục vụ cho các trường hợp sử dụng khác nhau.

Điểm mạnh của Figma nằm ở production, refinement và collaboration, tức là phát triển chính thức, hoàn thiện tinh chỉnh và cộng tác. Đúng là những điểm mạnh của Figma. Tôi rất thích nhóm Figma, họ đã phát triển sản phẩm đó rất phù hợp với tình huống này.

Còn cách tôi sử dụng Claude Design khác biệt. Vì tôi không phải là một nhà thiết kế toàn thời gian. Tôi thường tạo ra tài liệu giao tiếp trực quan, hoặc thực hiện một số khám phá tương tác. Đây không phải là vấn đề về độ tinh tế hoặc sản xuất cuối cùng, mục đích ở đây là cảm giác của một mockup sớm.

Tôi đã từng sử dụng Claude Design để tạo một bản prototype cho ứng dụng iOS của chúng tôi. Hiệu ứng pixel của nó khác biệt rất nhiều so với thứ chúng tôi sẽ phát hành cuối cùng, nhưng nó chỉ ra một hướng: tôi nghĩ rằng chúng ta nên có thể làm được điều gì trong không gian này. Vì vậy cả hai sẽ tiếp tục phát triển. Tôi đã dùng Claude Design và Figma làm ví dụ ở đây, nhưng bất kỳ sản phẩm nào tương tự đều vậy: mọi người đều đang tiếp tục tiến lên.

Tôi hy vọng ý tưởng tuyệt vời của chúng ta sẽ được áp dụng vào các sản phẩm khác, và ngược lại cũng thế. Tôi nghĩ mọi người thực sự đang cùng nhau khám phá: chúng ta cần xây dựng dạng sản phẩm nào để tối đa hóa việc sử dụng agents?

Tuần này, tôi đã có một cuộc trò chuyện tốt với một nhà nghiên cứu. Anh ấy nói, càng hạn chế hành vi của agent, cố gắng áp đặt các ràng buộc cụ thể quá mức, thì những phép màu tự nhiên bên trong sẽ càng khó diễn ra.

Tôi cảm thấy Claude Code thực sự thể hiện điều này, Co-work cũng một phần thể hiện điều này. So với đó, Claude.ai giống hơn là bạn đang trò chuyện, thực hiện một số công việc cụ thể rất cụ thể.

Chúng tôi sẽ tiếp tục xây dựng dạng sản phẩm này. Vai trò quan trọng nhất của nó là để cho nhiều người hiểu mẫu mô này, và tích hợp trải nghiệm tuyệt vời vào sản phẩm của họ.

Nếu những sản phẩm đó được định hình bởi Claude, thì tuyệt vời. Chúng tôi cũng hy vọng Claude sẽ tiếp tục là tốt nhất, hoặc ít nhất là một trong những nền tảng thông minh tốt nhất đứng đằng sau các sản phẩm AI thế hệ tiếp theo.

Tóm lại, vấn đề này thực sự phức tạp hơn trước đây nhiều. Tuy nhiên, chúng tôi vẫn sẽ cố gắng duy trì cùng nguyên tắc: cân nhắc rất cẩn thận về việc chúng tôi bước vào lĩnh vực nào, và đảm bảo rằng các mô-đun xây dựng ở mặt bên nền vẫn mở cho mọi người. Ví dụ như Managed Agents. Bây giờ bạn có thể xây dựng các thứ dựa trên Managed Agents mà bạn xây dựng từ bên ngoài, và mạnh mẽ như bất kỳ thứ gì mà chúng tôi có thể xây dựng bên trong.

Trừ khi vì lí do bảo mật, chúng tôi sẽ không bao giờ không phát hành một mô hình chỉ vì "khả năng giữ mô hình đó sẽ tạo ưu thế cho chúng tôi". Đó là nguyên tắc mà chúng tôi luôn tuân theo.

Chúng tôi chỉ sẽ phát hành khi chúng tôi tin rằng một sản phẩm hoàn chỉnh thực sự thể hiện điều gì đó mới mẻ.

Alex Heath: Vậy bạn và Dylan vẫn ổn chứ? Anh ấy trước đây cũng đã tham gia chương trình của chúng tôi, nên tôi muốn xác nhận một chút.

Mike Krieger: Tôi rất thích Dylan, cũng rất tôn trọng những gì họ đang làm.

Alex Heath: Đây là một câu hỏi khác của Ellis về chủ đề này. Bây giờ, đặc biệt là trong cộng đồng khởi nghiệp sớm, mọi người đang thảo luận về việc liệu công ty khởi nghiệp tiêu dùng còn khả thi không. Mọi người có thể nghĩ: Anthropic sẽ làm gì tiếp theo? Claude Design tiếp theo sẽ là gì? OpenAI sẽ làm gì tiếp theo?

So với đó, thị trường doanh nghiệp dường như an toàn hơn. Dario đã đề cập hôm nay, anh ấy tin rằng sẽ có một công ty "một người đạt 1 tỷ đô la" trong năm nay. Tôi đoán rằng đó có lẽ sẽ là một công ty doanh nghiệp.

Nhưng bạn nghĩ sao về tình hình hiện tại của các công ty khởi nghiệp tiêu dùng? Nếu quay trở lại thời điểm trước đây khi bạn tự làm Instagram với Kevin, đối mặt với môi trường như hiện nay, bạn sẽ có những hành động khác biệt nào?

Vì thế giới đã thay đổi rất nhiều. Bây giờ, khởi nghiệp tiêu dùng có vẻ khó hơn.

Mike Krieger: Tôi nghĩ, nếu phải phân tích quá trình bùng nổ sản phẩm tiêu dùng, cũng như là sự tồn tại ngoài vòng của bạn, một cách rất đơn giản, chắc chắn cần hai yếu tố.

Thứ nhất, đó là một khả năng hoặc hình thức mới nào đó. Với chúng tôi, vào thời đó đó là điện thoại chụp ảnh. Bây giờ không còn ai gọi nó là "điện thoại chụp ảnh" nữa, vì điện thoại đã có camera mặc định. Hoặc cũng có thể là hình thức truyền thông đa dạng hơn, như các sản phẩm như TikTok, Reels, vì khả năng truyền thông đã trở nên rất phát triển vào lúc đó.

Thứ hai, là một cơ chế phân phối có thể giúp bạn bùng nổ.

Đối với chúng tôi, thời đại đó vẫn còn có chút vẻ của "thế giới phương Tây". Bạn có thể chia sẻ ảnh Instagram lên Facebook, Twitter, Tumblr, và thậm chí là Posterous—điều này cũng đã phơi bày Instagram là một sản phẩm khá sớm. Tất cả các nền tảng này đều cho phép bạn liên kết tự do lại sản phẩm của mình, để bạn có thể tạo ra một vòng lặp tăng trưởng.

Nhưng ngày nay đã hoàn toàn khác rồi.

Tôi đã trò chuyện với một số nhà sáng lập, như nhà sáng lập của Locket, Matt. Họ đã tìm ra một số cách, chẳng hạn như bạn có thể tham gia vào không gian trò chuyện trên TikTok, từ đó mang lại một số khoảnh khắc tăng trưởng thú vị.

Nhưng theo tôi, hiện nay cảnh quan phân phối đã trở nên khó dự đoán hơn và không thể kiểm soát hơn.

Vì vậy, so với bất kỳ người chơi trí tuệ nhân tạo nào, tôi nghĩ rằng điều này có lẽ mới là xu hướng lớn nhất hiện nay hoặc thách thức lớn nhất: khi bạn đối mặt với cảnh quan phân phối như vậy, bạn phải làm thế nào để vượt ra khỏi vòng tròn?

Trước đây, bạn có thể đang cạnh tranh người dùng tương tác trên Facebook. Hãy để tôi đưa ra một ví dụ, có lẽ vào thời điểm đó, thời lượng sử dụng trung bình hàng ngày của Facebook là 15 phút. Nhưng bây giờ bạn đang cạnh tranh với TikTok. Tôi đoán thời lượng sử dụng trung bình hàng ngày của TikTok có thể vượt qua một giờ. Điều này thực sự khá điên rồ, nhưng đó chính là sự thật. Bạn phải cố gắng tranh giành một phần chú ý từ đó.

Vì vậy, nếu bạn cần hai yếu tố đó: khả năng hoặc hình dạng mới, cùng với cơ chế phân phối mới. Về phần yếu tố đầu tiên, có thể sẽ là một dạng tương tác mới với sự hiện diện do trí tuệ nhân tạo dẫn dắt; hoặc ngược lại, là trí tuệ nhân tạo giúp bạn bước ra khỏi cánh cửa, đi "tiếp xúc với thực tế", có nghĩa là trở về thế giới thực, tạo ra nhiều tương tác thật sự hơn.

Dù là cái nào, bạn vẫn phải giải quyết vấn đề thứ hai: phân phối.

Hiện nay nhiều sự chú ý đang chuyển hướng vào những hệ thống trò chuyện này. Nhưng theo tôi, không ai thực sự đã hiểu rõ: việc "lan truyền như virus" trong cuộc trò chuyện có ý nghĩa gì? Đến ngày nay, câu hỏi này thậm chí có vẻ không còn thích hợp.

Có lẽ đây sẽ là nơi xuất hiện một cái gì đó mới. Chẳng hạn nhơ chúng tôi đã ra mắt các ứng dụng MCP, như một tiêu chuẩn mở.

Alex Heath: Điều này có thể trở thành một loại hình phân phối giống như cửa hàng ứng dụng mới, phải không?

Mike Krieger: Có khả năng. Bạn có thể kết nối ứng dụng vào đó. Có lẽ ứng dụng MCP đầu tiên thực sự lan truyền như virus sẽ là một cái gì đó hướng tới người tiêu dùng. Điều đó sẽ thú vị, vì nó có thể là một cơ chế phân phối mới.

Tôi trước đây đã trò chuyện với một người liên quan đến dự án khám phá phi lợi nhuận. Chúng tôi đã từng viết một bài báo, giới thiệu cách MCP được sử dụng trong một số tình huống. Anh ấy nói rằng điều thú vị là anh ấy thấy "tăng trưởng theo kiểu virus" có nghĩa gì đối với một dự án khám phá phi lợi nhuận.

Con số đó tất nhiên không lớn lắm, nhưng anh ấy nói rằng khi anh ấy xem danh sách connector, họ đã đứng trong số năm ngày trong một số ngày, kế bên Gmail và Slack. Điều này đã đưa đến sự chú ý rất lớn đối với họ.

Vì vậy, hiện tại tôi đang suy nghĩ cùng bạn. Đây cũng là điểm thú vị của cuộc trò chuyện này. Chúng ta không nhất thiết phải có ngay một câu trả lời hoàn hảo. Nhưng có lẽ chúng ta sẽ thấy điều này sau này: liệu bạn có thể cung cấp giá trị thực tiễn đủ mạnh mẽ trong một khung lớn như Claude, ChatGPT hoặc Gemini, sau đó tìm ra một cách truyền bá thú vị?

Tôi rất mong chờ thấy điều này xảy ra.

AI Mạnh Mẽ, Quyết Định Được Hiếm

Alex Heath: Bạn gần đây đã thu âm một podcast cùng với Dan Shipper của Every. Tôi đã nghe phần đó, bạn đã nói về việc tái tạo Burbn bằng Claude. Đối với những người không biết, Burbn là ứng dụng trước đó của Instagram, sau đó bạn đã biến nó thành Instagram. Claude đã tạo ra nó trong vài phút.

Tôi rất tò mò, thứ nhất, từ mặt cảm xúc, khi nhìn thấy AI tạo ra cái mà bạn và Kevin đã mất rất nhiều thời gian mới làm ra, bạn cảm thấy như thế nào? Thứ hai, nếu Mike năm 2010 có thể sử dụng được Claude ngày nay, liệu Instagram có tồn tại không?

Mike Krieger: Đây là một câu hỏi rất hay.

Alex Heath: Vì tôi đoán rằng có lẽ AI không thể tự mình tìm ra hướng đó.

Mike Krieger: Đúng. Cảm nhận của tôi sau khi làm xong là: Thứ nhất, tôi rất rõ ràng về việc tôi đã đặt nó làm gì. Và tôi cũng đã nói với Dan về một điểm rất thú vị: Nó thực sự được xây dựng quá mức. Nó đã tạo ra bộ lọc trong Burbn, nhưng trong thời điểm đó, Burbn không có bộ lọc. Chúng tôi đã thêm bộ lọc vào Instagram sau này.

Vì Burbn hoàn toàn dựa trên Web. Lúc đó cũng không có cái như WebGL để tạo ra bộ lọc. Vì vậy việc thấy nó tự mình tạo ra điều đó có vẻ thú vị.

Tuy nhiên, theo tôi, quay lại cuộc trò chuyện về đội ngũ sáng lập nội bộ của Anthropic mà chúng ta vừa thảo luận, một phần lớn công việc sản phẩm vẫn là đặt ra những câu hỏi khó khăn đó, đưa sản phẩm đến cho người dùng thực sự xem.

Tôi vừa thích vừa không thích cảm giác bị người dùng "chửi thẳng mặt" lần đầu tiên khi đưa sản phẩm ra ngoài. Ai đó có thể nói: Đây là cái gì vậy? Tôi hoàn toàn không biết phải dùng như thế nào. Hoặc: Tôi rất bối rối.

Công việc đầu tiên của tôi sau khi tốt nghiệp chính là nghiên cứu UX, mỗi tuần tôi đều mời người tham gia vào phòng thí nghiệm để thử nghiệm. Đến bây giờ, tôi vẫn thích việc đó. Bạn dẫn người ta vào đây, với người dùng cuối cùng, liệu sản phẩm này có phải do Claude viết hay là do người viết bằng tay, thực sự không quan trọng. Họ chỉ quan tâm: Sản phẩm này có hữu ích không? Có thể sử dụng được không? Nó có tạo ra khoảnh khắc vui vẻ nào không?

Những điều này vẫn rất khó khăn. Claude sẽ không giải quyết các vấn đề này cho bạn. Vì vậy, nếu vào năm 2010 chúng tôi có Claude, chắc chắn sẽ có nhiều điểm giúp chúng tôi triển khai nhanh hơn, đặc biệt là khi đã rõ ràng về việc phải làm gì.

Ví dụ, sau khi chúng tôi phát hành, nhanh chóng nhận ra rằng cần thêm tính năng @mentions. Điều đó có thể mất một tuần, từ giao diện người dùng đến bộ máy trình bày văn bản, sau đó lưu trữ mặt trạc phía máy chủ, và giữa chừng có nhiều chi tiết cần xử lý. Nếu có Claude vào thời điểm đó, chúng tôi chắc chắn có thể hoàn thành nhanh hơn và cung cấp giá trị cho người dùng nhanh hơn.

Nhưng trên chuyến hành trình từ Burbn đến Instagram, tôi không nghĩ rằng Claude sẽ thay đổi nhiều. Ngoại trừ một số giai đoạn hùng biện lập trình, nó sẽ giúp chúng tôi nhanh hơn. Ít nhất là vào thời điểm ấy, tôi không cảm thấy việc mã hóa từ 0 đến 1 thường xuyên là yếu tố hạn chế. Yếu tố hạn chế thực sự là quá trình suy nghĩ và khám phá.

Vì vậy, điều tôi muốn nói là: những việc khó vẫn rất khó.

Tôi có một lo lắng: Nếu LLM đã đưa ra quá nhiều quyết định sẵn sàng sử dụng, liệu điều đó có thể ngăn cản bạn tìm ra hình dáng sản phẩm khác biệt, bất ngờ hơn không?

Tất nhiên, bạn cũng có thể tận dụng nó. Bạn có thể nói, tốt, hãy giúp tôi tạo ra ba phương án thay thế, sau đó tôi sẽ xem phần nào cảm thấy phù hợp. Tôi cũng đã làm như vậy.

Nhưng điều đó chắc chắn không giúp bạn tránh khỏi việc đưa ra những quyết định sản phẩm khó khăn. Thực tế, bạn cần phải đưa ra những quyết định đó hơn.

Alex Heath: Tôi cảm thấy vấn đề này trở nên quan trọng hơn.

Tôi cũng có cảm giác này trong công việc của mình. Công việc của tôi không phải là viết phần mềm, mà là tạo nội dung truyền thông. Tôi có thể giao cho Claude nhiều thứ hơn, có thể để cho file kỹ năng cố gắng nhắc nhở nó về phong cách tôi thích, v.v.

Tuy nhiên, khi tôi đọc nội dung thực sự được tạo ra, tôi vẫn cảm thấy: Hmm, không hoàn toàn đúng. Sau đó, tôi sẽ tương tác với nó như là tôi đang làm việc với biên tập viên và phóng viên.

Mike Krieger: Đúng.

Alex Heath: Tôi nghĩ rằng, khi khả năng của nó mạnh lên, khả năng này trở nên quan trọng hơn. Bởi vì tôi không muốn mất đi trực giác của mình trong quá trình này. Tôi cảm thấy rằng nhiều người có thể bắt đầu quá mức phụ thuộc vào AI do sự phát triển nhanh chóng của lĩnh vực lập trình trí tuệ nhân tạo. Tôi hy vọng sau này chúng ta có thể trở lại trạng thái cân bằng hơn.

Mike Krieger: Tôi nghĩ rằng trực giác của con người vẫn rất quan trọng. Tôi thích cách bạn ví von về "phóng viên và biên tập viên". Trừ khi phóng viên đã đi quá xa, hầu hết thời gian, biên tập viên đối diện với một bảng dự định đã gần đúng với nội dung bạn muốn.

Alex Heath: Trước đây, tôi đã gặp tình huống đi quá xa hoàn toàn.

Mike Krieger: Nhưng hầu hết thời gian, biên tập viên có thể cảm thấy: Bài viết này đã gần 90% đạt đến trạng thái mình muốn, chỉ cần chỉnh sửa thêm sẽ lên tới 95%; hoặc nó đang ở mức 80 đến 85 điểm ngay bây giờ.

Nhưng nếu bạn tham gia vào việc định hình ngay từ đầu, có lẽ bạn có thể đạt đến gần 100%. Tất nhiên, những điều này không thể được đo lường chính xác.

Tôi đã có trải nghiệm này khi xây dựng các phần trong Labs nội bộ. Điều tôi học được bây giờ là: tốt nhất là trò chuyện một cách chi tiết hơn với nó trước khi Claude viết bất kỳ dòng mã nào, làm cho mọi thứ trở nên rõ ràng. Sau đó tôi sẽ nói rằng, đúng, phương hướng này cảm thấy đúng, chúng ta đã hiệu quả hợp tác để tạo ra một spec, bây giờ bạn hãy triển khai nó.

Nếu tôi chỉ đưa ra mô tả chức năng ở mức cao, nó thực sự sẽ tạo ra chức năng đó. Tất cả các cơ chế xác thực chúng tôi đang xây dựng cũng sẽ đảm bảo rằng nó hoạt động trong khía cạnh chức năng.

Nhưng sau đó khi tôi nhìn lại, tôi lại cảm thấy: Nếu là tôi, tôi sẽ làm một cách khác. Vấn đề là, nó đã hoàn thành. Cảm giác "không hoàn toàn đúng" đó, tôi không thích.

Vì vậy, chúng tôi đang chuyển sang một cách tiếp cận: trước tiên làm cho sao Bắc trở nên rõ ràng, sau đó giúp Claude hội tụ một cách hiệu quả đến ngôi sao Bắc đó.

Có người trong công ty nói rất hay: khi chúng ta lập trình với Claude, hạt nhân của toàn bộ công việc là thể hiện rõ mục tiêu, cũng chính là hướng đi cuối cùng, sau đó giúp Claude hội tụ theo hướng đó.

Đó là một loại hướng dẫn, ở một khía cạnh nào đó cũng là người quản lý. Tất nhiên, manager trong phần mềm thường liên quan nhiều đến phát triển con người. Vì vậy có lẽ giống kiến trúc sư hơn. Nhưng tôi vẫn chưa tìm ra một từ hay lắm.

Nó giống hơn như là "hướng dẫn viên" hoặc "người Sherpa" của dự án và Claude: bạn cùng nó tiến về mục tiêu, chứ không phải mong nó tự động hoàn tất ngay từ đầu, và cũng không phải bạn hoàn toàn không tham gia vào việc định hình hướng đi ban đầu.

Alex Heath: Có rất nhiều điểm tương đồng đáng chú ý giữa Instagram và Anthropic. Tôi nhớ rằng vào giai đoạn đầu của Instagram, một vấn đề khiến các bạn đau đầu: sức mạnh tính toán hoặc nói đúng hơn là khả năng chứa đựng của máy chủ đỡ App. Lúc bấy giờ, các bạn không có đủ máy chủ. Một lúc nào đó, các bạn phải nghĩ ra cách giải quyết vấn đề này.

Mike Krieger: Đúng vậy.

Alex Heath: Và giao dịch đó đến rất nhanh.

Bây giờ, điều thú vị là, đã qua mười năm, sức mạnh tính toán vẫn là vấn đề. Mặc dù tôi biết rằng bạn không phải là người trực tiếp chịu trách nhiệm về sức mạnh tính toán, nhưng tôi nghĩ, bên trong Anthropic, sức mạnh tính toán chắc chắn là vấn đề mà các bạn thường xuyên phải suy nghĩ. Khi các bạn gia nhập "phòng thí nghiệm trí tuệ nhân tạo nhỏ" này, có lẽ các bạn không ngờ đến điều này.

Mike Krieger: Có hai đoạn nhỏ rất tốt để nói về điều này. Đoạn đầu tiên cũng cho thấy, trong hai năm qua, tôi thực sự đã học được rất nhiều.

Khi phiên bản Claude 3.5 ra mắt, vào ngày phát hành, mặc dù lúc đó quy mô của chúng tôi so với hiện tại nhỏ hơn nhiều, người dùng đã bắt đầu chấp nhận nhanh chóng. Chúng tôi gần như đã lấp đầy tài nguyên chip mà lúc bấy giờ đã phân bổ cho chúng tôi.

Tôi nhớ tôi hỏi đội cơ sở hạ tầng: "Được, vậy nếu tài nguyên hết, chúng ta phải làm sao? Thêm dung lượng phải không?"

Vì trong thế giới Instagram hồi đó của tôi, trừ khi bạn sử dụng một loại phần cứng rất đặc biệt trên AWS, nếu không ở ngoài vẫn còn nhiều phần cứng khác có thể sử dụng.

Kết quả là họ nói: "Không, không, không. Nếu tài nguyên đó hết, thì thật sự là hết. Những GPU đó đã được phân bổ hoàn toàn đi rồi. Tất nhiên, chúng tôi đang cố gắng lấy thêm tài nguyên."

Lúc đó, tôi nhận ra: "Ồ, đây đúng là một môi trường rất khác biệt. Bạn không thể giải quyết vấn đề bằng cách click chuột vào 'tạo một thực thể mới' như trước kia."

Alex Heath: Vì vậy đó là lý do mà bạn có vẻ như đang cùng Elon lên không gian.

Mike Krieger: Chính xác. Chúng tôi thực sự đang tìm kiếm nguồn sức mạnh tính toán mới, thậm chí có thể là không ngờ đến. Đó là một quá trình học rất nhanh chóng đối với tôi. Tôi ngay lập tức hiểu và nội hóa được vấn đề này.

Hiện nay, chúng tôi thực sự đang quan tâm nhiều đến vấn đề sức mạnh tính toán. Ngay cả trong một sản phẩm đơn, bạn cũng không muốn hy sinh mức độ thông minh. Vì vậy, vấn đề trở thành: Làm thế nào để cung cấp khả năng thông minh một cách tối đa, đồng thời không lãng phí lực lượng tính toán? Ví dụ, điều gì có thể được xử lý không đồng bộ? Khi nào phải sử dụng mô hình lớn nhất? Khi nào có thể sử dụng mô hình nhỏ hơn?

Vì vậy, sức mạnh tính toán thực sự là một yếu tố quan trọng. Tôi nghĩ rằng từ nhiều khía cạnh, điều này cũng là điều mà cần phải. Nó cũng giúp chúng tôi gần hơn với tình hình của khách hàng. Bạn mới đề cập đến vấn đề của khách hàng, họ cũng sống trong một thế giới: bản chất họ đang mua token, sau đó chuyển bán token đó dưới dạng một loại sản phẩm nào đó.

Vì vậy, chúng tôi ở nhiều khía cạnh giống họ, đều hy vọng sinh thái này là một cộng đồng lành mạnh. Trong năm qua, bạn đã thấy thị trường chuyển hướng rõ rệt hơn đến cơ cấu giá dựa trên token hoặc dựa trên việc sử dụng, cũng có nghĩa là tính phí dựa trên token hoặc dựa trên lượng sử dụng.

Tôi nhớ một năm trước khi nhìn vào sinh thái này, tôi thường nghĩ: Khách hàng của chúng tôi muốn nhận giá cao hơn, hoặc muốn cung cấp giá trị hơn, nhưng họ bị hạn chế bởi mô hình giá hiện tại.

Và bây giờ, ngày càng nhiều khách hàng thực sự có thể tận hưởng giá trị xung quanh khả năng thông minh, hoặc ít nhất cho phép người dùng tùy chỉnh mối quan hệ giữa chi phí và khả năng. Ví dụ, bạn có thể nói: Tôi muốn tối ưu hóa chi phí, vì vậy tôi sử dụng một mô hình không quá tiên tiến, nhưng tôi biết mình sẽ nhận được giá trị gì; hoặc tôi thực sự muốn làm điều này tốt, vì vậy tôi sử dụng chế độ nhanh, tiêu tốn nhiều token hơn, vì tôi có thể điều chỉnh con nút này.

Như vậy, đúng vậy, tại Anthropic, sức mạnh tính toán rõ ràng quan trọng hơn so với thời đại Instagram. Nhưng ở một mức độ nào đó, hai thời đại cũng tương đồng: Sự tăng trưởng của Instagram vào thời điểm đó cũng như là tăng trưởng theo cấp số nhân, ít nhất là nếu bạn tính lại thì là như vậy.

Alex Heath: Dario nói rằng trong quý đầu tiên, sản phẩm của bạn Claude Code đã tăng khoảng 80 lần. Tôi không biết Instagram có từng tăng 80 lần không.

Mike Krieger: Không. Tôi nghĩ ngoại trừ giai đoạn từ 100 lên 10 vạn trong tuần đầu tiên, chúng tôi thực sự có một mức tăng ổn định, khá tốt, nhưng không giống như vậy.

Alex Heath: Chúng ta có thể kết thúc ở đây. Bạn tại Anthropic thực sự được xem là rất sớm. Mặc dù tôi nói "sớm", nhưng thực tế đã hai năm rồi, nhưng trong thế giới trí tuệ nhân tạo, điều này vẫn là rất sớm.

Văn hóa của Anthropic khiến tôi thấy rất thú vị. Càng tiếp xúc với mọi người trong công ty, tôi càng cảm nhận điều này. Rất nhiều người nhìn vào Anthropic từ bên ngoài, sẽ thấy đủ loại tiêu đề, thấy Mythos, thấy Dario nói về việc có thể 50% công việc sẽ biến mất. Rất nhiều người sẽ nói: họ chỉ đang tạo ra nỗi sợ, hoặc chiến lược bị bắt giữ bởi quản lý ở đây.

Nhưng tôi thấy văn hóa của Anthropic rất độc đáo. Tôi rất tò mò, theo quan điểm của bạn, sự khác biệt lớn nhất giữa sự hiểu biết bên ngoài về Anthropic và sự tin tưởng thực sự bên trong Anthropic vào việc họ đang làm là gì?

Mike Krieger: Đây là một điều rất khó để thuyết phục người khác tin. Bởi vì tôi có thể nói mãi mãi: Chúng tôi là một công ty rất minh bạch. Những gì chúng tôi nói ra, đó chính là những gì chúng tôi thực sự nghĩ.

Dario có lẽ là người trực diện nhất mà tôi từng gặp. Anh ta nói ra suy nghĩ của mình, không phải dựa trên tính toán kỹ lưỡng: "Nói như vậy có giúp tôi hút vốn mới không?" Hoàn toàn không phải vậy.

Sau khi tôi và anh ta trở nên thân thiết hơn, thấy anh ta làm sao bên trong và bên ngoài, tôi rõ ràng, điều này không phải là động lực đằng sau cách anh ta giao tiếp hoặc phát triển chiến lược sản phẩm. Tất nhiên, nói thì dễ, nhưng làm như vậy lâu dài lại là vấn đề khác.

Nhưng có lẽ tôi có thể dùng một ví dụ nội bộ để giải thích. Năm nay, từ góc độ tăng trưởng kinh doanh, tăng lượng sử dụng, v.v., đều rất tốt. Nhưng tôi nghĩ rằng, lý do mà công ty vẫn giữ vững "grounded", nghĩa là không mất trọng tâm, là vì mục tiêu của Anthropic không phải là xây dựng một tập đoàn kinh doanh lớn mạnh.

Mục tiêu của Anthropic là làm hết khả năng của chúng ta, đưa thế giới tiến tới một tương lai AI tốt đẹp hơn. Một khi bạn nhìn mọi thứ từ góc độ này, nó có thể giải thích rất nhiều quyết định tiếp theo.

Tất nhiên, tôi không thể yêu cầu người khác không nghi ngờ. Cuối cùng, chúng tôi vẫn phải tiếp tục chứng minh qua hành động: Chúng tôi không phải đang tạo ra nỗi sợ, cũng không phải vì nghĩ rằng như vậy sẽ làm cho bản thân trở nên hiện đại hơn mà cố ý giữ lại một số thứ.

Tôi đưa ra một ví dụ. Niềm tin bên trong công ty là: Chúng ta nên có thể phát hành một mô hình cấp Mythos một cách an toàn. Nhưng cho đến nay thì chúng tôi vẫn chưa làm được điều đó, thực sự đó không phải là điều tốt. Chúng tôi không tự hào về điều này.

Vì nếu chúng ta làm điều này đúng, tất cả các trường hợp sử dụng tích cực sẽ trở nên có thể. Vừa rồi chúng ta đã nói về khoa học về sống, trên mô hình Mythos như vậy, có thể sẽ xuất hiện rất nhiều điều thú vị. Tôi cũng đã viết nhiều phần mềm bên trong với Mythos, nó thực sự mạnh mẽ ở mặt này.

Alex Heath: Bên trong phần mềm của bạn không có rủi ro bảo mật mạng, phải không?

Mike Krieger: Đúng. Chúng tôi đã tìm cách thực hiện điều đó một cách an toàn nhất có thể. Nhưng đó là cách chúng tôi nhìn thế giới. Chúng tôi muốn trao quyền này cho mọi người và không muốn nén chúng. Chúng tôi đang làm việc rất chăm chỉ để tránh việc không thể phát hành tính năng vì vấn đề bảo mật.

Vì vậy, điều này thực sự cần phải được chúng tôi chứng minh. Tôi nghĩ việc người ta yêu cầu chúng tôi chứng minh điều này là công bằng.

Nhưng khi tôi thấy có người nói: "Họ chỉ muốn tăng giá trị công ty trong vòng kế tiếp" "Họ chỉ muốn tỏ ra mình rất giỏi" "Họ thực sự không tin vào những điều đó", ít nhất trong phạm vi mà bạn tin tưởng vào tôi, tôi có thể nói, điều này không phải là động lực thực sự bên trong của Anthropic.

Nhưng, câu nói cũ vẫn đúng, nhiệm vụ của chúng tôi là chứng minh điều đó theo thời gian.

Alex Heath: Câu hỏi cuối cùng. Khi ai đó đến với bạn và nói: Mike, tôi rất lo lắng về công việc của mình. Tôi cũng lo lắng về an ninh kinh tế của gia đình, con cái, ông bà của mình. Bạn sẽ trả lời họ như thế nào?

Mike Krieger: Tôi sẽ không nói với họ "Đừng lo lắng". Vì tôi thực sự tin rằng, sẽ có sự thay đổi lớn xảy ra. Chúng ta không biết nó sẽ xảy ra nhanh như thế nào. Mọi người có thể có nhận định khác nhau về thời gian, nhưng sự thay đổi đã đang diễn ra.

Gần đây, tôi nhận được một số email, nhiều trong số đó là những người tôi biết trong các cơ hội xã hội hoặc nghề nghiệp, con cái của họ vừa tốt nghiệp đại học. Họ sẽ hỏi: Chúng tôi nên làm gì? Thông thường, tôi sẽ nói với họ một điều tôi tin: Vấn đề này không phải là một công ty hoặc một bộ phận nào đó của chính phủ có thể giải quyết. Nó đòi hỏi một cuộc trò chuyện ở mức xã hội.

Nếu nói rằng chúng ta luôn cố gắng làm điều gì đó, đó chính là thúc đẩy cuộc trò chuyện đó diễn ra. Mặc dù đôi khi điều đó có thể bị hiểu lầm là gây hoang mang. Dù là việc thiết lập cấu trúc thuế khác nhau, hoặc việc tái đào tạo lại kỹ năng, thực sự cần xảy ra cùng nhau. Tôi nghĩ bạn cũng đã thấy, gần đây chúng ta đã bắt đầu trở nên cụ thể hơn trong một số đề xuất chính sách.

Nếu thực sự phải trả lời một người, đó sẽ là một câu trả lời dài. Vì vấn đề từ bản thân đã rất phức tạp. Nhưng tôi sẽ nói với họ: Bạn không phải một mình. Đây là một vấn đề phức tạp cần phải đối mặt cùng nhau.

Tôi cũng tin rằng, một số điều vẫn sẽ giữ nguyên bản tính của con người, khó diễn tả và rất quan trọng. Ví dụ như mối quan hệ, sự tò mò, sự sáng tạo, và khả năng tụ họp một nhóm người để tiến về một mục tiêu. Những điều này vẫn sẽ rất quan trọng. Tôi không nghĩ rằng AI sẽ nhanh chóng thay thế những điều đó.

Nếu bạn có thể nắm vững khả năng này, hoặc ít nhất là tiếp tục nuôi dưỡng và phát triển nó, tôi nghĩ rằng điều này rất quan trọng.

Hơn nữa, đừng xem hiện tại là một trạng thái cố định. Mọi thứ vẫn sẽ tiếp tục thay đổi. Ngay cả trong thời điểm hiện tại đầy bất định, hoặc thậm chí là khó khăn, việc một đứa trẻ của một người bạn không đạt được công việc mà chính họ mong muốn nhất không có nghĩa là mọi thứ đã ổn định. Không có điều gì là cố định.

Nếu mọi người có thể duy trì sự tò mò, tiếp tục tự chủ tìm hiểu xem tương lai sẽ ra sao, họ có thể tham gia vào việc tạo ra một hạng mục công việc hoàn toàn mới, hoặc thậm chí chuyển sang một vị trí khác trong công ty của mình.

Tôi nghĩ rằng toàn bộ bức tranh sẽ tiếp tục thay đổi. Vì vậy, đừng xem giai đoạn không chắc chắn, khó khăn hiện tại là một trạng thái tĩnh mà sẽ làm mọi người mắc kẹt.

Alex Heath: Được, Mike, tôi sẽ để bạn quay trở lại phòng thí nghiệm. Cảm ơn bạn đã đến trò chuyện.

Mike Krieger: Rất vui được gặp bạn.

Alex Heath: Cảm ơn.

Mike Krieger: Cảm ơn.

[Liên kết video]

Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

##trí tuệ nhân tạo

Báo lỗi/Báo cáo