原文标题:The Wu Tapes
原文作者:Jeremy Stern
编译:Peggy,BlockBeats
编者按:Trong bối cảnh khả năng mô hình lớn liên tục tràn ngập và AI agent từ khái niệm đi đến sản phẩm, cuộc thảo luận trong ngành đang chuyển từ "mô hình mạnh đến đâu" sang "AI thực sự làm thế nào để tiếp quản công việc phức tạp". Nhưng khi mã nguồn tự động tạo ra, tự động sửa lỗi bug, và thực hiện nhiệm vụ tự lập lâu dài dần trở thành hiện thực, một vấn đề quan trọng hơn bắt đầu nổi lên: Cuộc tranh chấp giai đoạn tiếp theo của AI, liệu đó là cuộc tranh chấp về khả năng mô hình, hay là cuộc tranh chấp về tổ chức, sản phẩm và cơ sở hạ tầng?
Bài viết này là kết quả của cuộc phỏng vấn chi tiết của Jeremy Stern với Scott Wu, người sáng lập và CEO của Cognition. Scott Wu là người đoạt huy chương vàng Olympic Tin học quốc tế, cũng là một trong những người sáng lập cốt lõi nhất đằng sau AI programming agent Devin. Cognition tiếp cận việc tự động hóa kỹ thuật phần mềm thông qua Devin, cố gắng đưa AI từ "công cụ hỗ trợ" sang "đồng nghiệp tự lập".
Lưu ý: Devin là một AI programming agent do Cognition phát triển, có thể được hiểu là một "kỹ sư phần mềm AI".
Trong cuộc trò chuyện này, Scott Wu không chỉ đơn giản là kể một câu chuyện về một thiếu niên thiên tài sáng lập một "con rồng AI", mà là phân tích sự trỗi dậy của AI agent thành một tập hợp các vấn đề cấu trúc sâu hơn: làm thế nào khả năng mô hình được chuyển hóa thành năng suất thực tế, thiên tài công nghệ trở thành tổ chức khởi nghiệp, công nghệ phần mềm tại sao trở thành điểm nhập cửa đầu tiên để AI biến đổi thế giới thực, và khi sự nhận thức chính bản thân bị tự động hóa, giá trị của con người cần được định vị lại như thế nào.
Thứ nhất, là phong cách công nghệ chuyển từ "hoàn thiện" sang "ủy quyền". Trước đây, trí tưởng tượng chính thống về AI dựa trên sinh ra vẫn dừng lại ở việc hoàn thiện văn bản, câu hỏi và hỗ trợ mã nguồn, AI giống như một công cụ đáp ứng. Nhưng theo Wu, sự thay đổi thực sự đến từ việc xuất hiện hình thái agent: nó không đợi chờ người dùng gợi ý từng chữ, mà giống như đồng nghiệp nhận nhiệm vụ, hiểu thư viện mã, gỡ lỗi, kiểm tra, và nộp kết quả có thể xem xét. Điều này ngụ ý rằng, hạt nhân của sản phẩm AI không còn chỉ việc gọi mô hình, mà là liệu có thể nhúng vào quy trình làm việc thực tế, tiếp tục hoàn thành nhiệm vụ môi trường cao.
Thứ hai, là công nghệ phần mềm từ "lao động dày đặc của con người" chuyển sang "công nghiệp hóa quá trình nhận thức có thể được mở rộng". Trước đây, việc viết mã phụ thuộc vào thời gian, kinh nghiệm của kỹ sư và băng thông nhóm, một nhóm luôn có dự án không bao giờ hoàn thành, chỉ có thể lựa chọn trong tài nguyên hạn chế. Hướng dẫn mà Devin đại diện, là để cho AI đảm nhiệm một số lượng lớn công việc tầng lớp thực thi, giải phóng kỹ sư khỏi việc mã hóa lặp đi lặp lại, gỡ lỗi và bảo trì. Điều này không có nghĩa là sáng tạo phần mềm biến mất, mà là bottlenecks sản xuất phần mềm từ việc "ai viết" chuyển sang "ai định nghĩa vấn đề, thiết kế kiến trúc và đánh giá sự lựa chọn".
Thứ ba, là sự thay đổi trong hình ảnh của nhà khởi nghiệp AI. Trước đây, các công ty công nghệ thường được hiểu là sự kết hợp giữa trực giác sản phẩm kiểu Jobs, cách kể chuyện về kinh doanh và sức hút tổ chức; trong lĩnh vực cao cấp công nghệ như AI và crypto, người sáng lập mới ngày càng đến từ toán học, các cuộc thi lập trình và hệ thống đào tạo lượng tử. Ưu điểm của họ không chỉ là trí tuệ mà còn là khả năng phân tích, tinh thần cạnh tranh và cơ chế tự phản hồi mà môi trường cạnh tranh lâu dài đã lọc ra. Điều này có nghĩa là, trong thời đại AI, cuộc cạnh tranh khởi nghiệp đang ngày càng chặt chẽ hơn với khả năng đánh giá công nghệ, hiểu biết nghiên cứu và khả năng triển khai sản phẩm.
Thứ tư, là nguy cơ AI chuyển từ câu chuyện tận thế trừu tượng sang sự ma sát thực tế của sự thích nghi. Lo lắng của Wu về AI không chủ yếu đến từ công nghệ chính mà đến từ tốc độ lan truyền công nghệ quá nhanh gây ra sự mất cân bằng: một số ít tinh hoa sẽ nhanh chóng có được khả năng, trong khi các tổ chức phổ thông, hệ thống giáo dục và cơ cấu phòng thủ an ninh vẫn chưa kịp theo kịp. Đặc biệt là trong an ninh mạng, cơ sở hạ tầng phần mềm và hệ thống sản xuất doanh nghiệp, nếu khả năng tấn công lan rộng trước khả năng phòng thủ, xã hội sẽ đối mặt với sự mất cân bằng phức tạp hơn.
Thứ năm, là giá trị của con người chuyển từ "khả năng giải quyết vấn đề" sang "đặt mục tiêu và tự diễn đạt". Nếu cuối cùng AI có thể đảm nhận ngày càng nhiều công việc lao động trí não cơ bản, thì con người sẽ không còn giới hạn bởi khả năng tính toán, suy luận logic hay hiệu suất thực thi. Câu trả lời của Wu mang tầm quan trọng kỳ vọng vào công nghệ: AI sẽ đẩy con người từ "chế độ sinh tồn" sang "chế độ sáng tạo". Nhưng điều này cũng đặt ra câu hỏi sâu hơn: khi nhận thức được sao chép, thực thi tự động hóa, phần thực sự không thể thay thế của con người có lẽ không còn là khả năng bản thân mà là bộ nhớ, ngữ cảnh, khao khát, phẩm giá và cách chúng ta lựa chọn sử dụng khả năng.
Nếu nhìn nhận cuộc trò chuyện này một cách tóm gọn, thì có thể nói rằng: Ý nghĩa của Devin không chỉ là một sản phẩm lập trình AI, mà còn là một thử nghiệm sớm của AI agent nhập vào hệ thống sản xuất thực sự. Theo nghĩa này, đối tượng được thảo luận trong bài viết không còn chỉ là Scott Wu hoặc Cognition, mà là sự chuyển đổi cấu trúc của ngành công nghiệp AI từ sự sùng bái mô hình sang tái cấu trúc quy trình làm việc, từ khả năng trình diễn sang cơ sở hạ tầng sinh sản sản xuất.
Dưới đây là nội dung gốc (được chỉnh sửa để dễ đọc và hiểu):

Có một câu chuyện cổ điển về thiên tài toán học, một câu chuyện đã lôi cuốn sự tưởng tượng của công chúng trong thời gian dài.
Đó là thời đại mà người Mỹ vẫn tin rằng họ có thể chiến thắng trong chiến tranh, và các dân biểu sách trường sẽ bị đẩy vào tủ đồ.
Các câu chuyện của loại này thường tuân theo một cấu trúc bốn cảnh quen thuộc.
Cảnh 1: Một bằng chứng hoặc định lý mới xuất hiện, một thiên tài với tài năng vượt trội phá vỡ toàn bộ lĩnh vực, qua đó khiến cho các tác giả có uy tín, người nổi tiếng đã giành giải thưởng, và tất cả những người mà anh ta đã làm lung lay vị thế của họ cảm thấy bị xúc phạm.
Cảnh 2: Anh ta bắt đầu tạo dựng lại uy tín cho bản thân. Bằng luận văn, bài thuyết trình, sự xuất hiện công khai, cùng với một nhóm học sinh và người theo đuổi trung thành, hình thành một cuộc vận động bào chữa kéo dài. Mọi nơi đều bị cản trở, nhưng cuối cùng vẫn buộc các cơ quan thể chế phải không nguyễn chấp công nhận giá trị của anh ta. Trong khi đó, các cơ quan chính phủ và tình báo nước ngoài cũng bắt đầu quan tâm và cố gắng tận dụng anh ta.
Cảnh 3: Các triệu chứng nghiêm trọng của mất ngủ, nghi ngờ và mất cân bằng tinh thần trở nên không thể bỏ qua. Ly dị, dinh dưỡng kém, tự tổn thương, tâm thần viện, hoặc trở thành một nhân vật kỳ lạ trên trường — đi vào buổi học diễn thảo mặc áo choàng tắm, viết các ký hiệu và câu chữ kinh dị trên bảng.
Cảnh 4: Sự sụp đổ tinh thần không thể đảo ngược, an thần bằng thuốc, hoặc cái chết. Sau đó, thần thoại bắt đầu hình thành: Sự điên rồ được giải thích là giá phải trả mà thiên tài phải trả, câu chuyện của anh ta đi vào giáo trình đại học và hệ thống nền văn hóa tầng lớp trung lưu, trở thành nguyên liệu mà các giải thưởng văn học, viết tự truyện, và phim truyền hình ứng cử Oscar lặp đi lặp lại.
Chúng ta vẫn thích kể những câu chuyện như vậy cho đến ngày nay. Sự thành công của "A Beautiful Mind" và "Good Will Hunting", cùng với viết lách gần đây của Jonathan Rosen và Benjamin Rapaport chỉ là một số ví dụ. Nhưng hầu hết những câu chuyện này phải quay trở lại thế kỷ 20, điều này không phải là ngẫu nhiên.
Trong tứ phần đầu tiên của thế kỷ 21, số phận của những nhà máy robo hàng đầu ở Mỹ đã trải qua một bước ngoặt.
Hôm nay, người đồng nghiệp trong lĩnh vực của "thiên tài học đường" không còn xem anh ta như một mối đe dọa cá nhân, mà thay vào đó có thể coi anh ta như một khoản đầu tư rủi ro với lợi nhuận theo phân phối mũi chuẩn, hoặc một cơ hội mua lại tài năng với giá bán chữ số chín. Các cơ quan chính phủ trong và ngoài nước, đặc biệt là các cơ quan tình báo, cũng không còn chỉ là người theo dõi tiềm năng, mà có thể trở thành khách hàng, đối tác cộng tác, hoặc thậm chí đường dây kinh doanh của anh ta. Những người bị từ chối trước đây bây giờ đã trở thành học sinh trường Ivy League.
Người đó cũng không còn cần phải hoàn thiện câu chuyện thông qua sự nghi ngờ và ẩn dật. Hình ảnh quá khứ với việc hoàn toàn cách biệt với gia đình, xã hội, và hiện thực đang được thay thế bằng một lối sống khác: Mạng lưới quan hệ xã hội cao cấp, thiền phương Đông, trải nghiệm ma thuật, đạo đức ăn uống hiệu quả cùng quản lý giấc ngủ tối ưu hóa. Anh ta không cần phải đi trần chân trên bãi cỏ của trường, thì thầm những ảo tưởng huỷ diệt. Anh ta chỉ cần tham gia chương trình truyền hình, nói với Anderson Cooper rằng công nghệ mà anh ta đang xây dựng có thể phá huỷ hàng loạt việc làm, hoặc thay đổi số phận loài người — và bất cứ điều gì, điều này đều có thể tạo ra giá trị cho cổ đông.
Điều quan trọng hơn có lẽ là, cảm xúc của thế hệ trước với "sự thật" hầu như đã biến mất. Trong sự mê tín đó, chứa đựng đồng thời hai điều: hy vọng được hiểu biết, và sẵn lòng bị đày ải vì sự không hiểu biết.
Hiện nay, danh tiếng, giàu có và quyền lực đã không còn cần phải chờ đến sau khi chết mới được công nhận. Chúng có thể được thể hiện ngay lập tức thông qua định giá, IPO, quyền kiểm soát cơ sở hạ tầng quan trọng, việc đưa ra lời kêu gọi từ các nhà lãnh đạo quốc gia, khả năng phân phối người và hệ thống theo thời gian thực. Chúng cũng sẽ được làm sạch, phóng đại và hợp lý hóa hàng ngày trên đường thời gian X: một nhóm người hâm mộ được thuần hóa bởi công nghệ, đưa thiên tài học thuật công bằng sở hữu của họ, cũng như các khiếm khuyết về bản tính mà họ đã công khai, vào truyền thuyết khởi nghiệp kiểu Steve Jobs, và khẳng định mạnh mẽ rằng đó chỉ là một cơn bão giông tạm thời theo mô hình "người sáng lập".
Đó cũng là lý do tại sao, "Ông lớn trí tuệ nhân tạo được yêu mến" về bản chất là một phép tu từ mâu thuẫn theo phong cách tiệc cocktail, giống như "Kẻ phản diện Canada" hoặc "Diễn viên hài Đức" vậy.
Không ai thực sự thích thú với tình hình này. Ngay cả những người không lo lắng về việc mất việc làm văn phòng, không cần phải hiểu rõ cách trung tâm dữ liệu tiêu thụ tài nguyên nước, và không chứa nỗi căm hận công nghệ mạnh mẽ nội tâm, cũng khó mà cảm thấy thoải mái với điều đó.
Vì người Mỹ vẫn sâu sắc ở trong văn hóa là tầng lớp trung lưu. Họ tự nhiên tin rằng điều phải thuộc về thiên tài học thuật, không phải là được mời tham gia cùng các ngôi sao truyền thông tại Cannes, cũng không phải đứng ở một vị trí mạnh mẽ hơn cả quốc gia. Anh ta nên phục vụ cho an ninh quốc gia, hoặc đi khám phá ngôi sao; sau đó, có thể gia nhập làm việc ở một công ty "thực sự" như Costco; cuối cùng nghỉ hưu ở một căn nhà cấp ấm, yên tĩnh, có cửa sổ nhỏ tại khu nhà trường đại học, suy ngẫm về cách xây dựng một "điểm đột phá nhẹ" hoặc "trí não toàn cầu" - và nhắc nhở mọi người rằng nếu hệ thống này rơi vào tay của người khác, thì có thể "giết chết tất cả mọi người".
Những người giữ niềm tin đến như vậy có thể đang giúp bạn đóng gói hàng tại siêu thị, hoặc đang mời bạn tham gia vào chương trình podcast của họ. Như bạn đã biết từ trước, họ sẽ cuối cùng cũng sẽ tham gia vào câu chuyện công nghệ này. Nhưng nếu bạn vẫn muốn họ tiếp tục nộp thuế, tiếp tục tuân thủ sắp xếp chế độ, thậm chí còn tiếp tục chiến đấu cho đất nước khi cần thiết, thì "Thần" mà bạn muốn xây dựng phải được đưa vào một hộp mà họ có thể hiểu, chấp nhận được.
Điều này đưa chúng ta đến với Scott Wu.
Scott Wu, người sáng lập kiêm CEO của Cognition, hiện đang điều hành một công ty trí tuệ nhân tạo. Công ty này được coi là một trong những cái tên mới đáng chú ý nhất trong lĩnh vực ứng dụng trí tuệ nhân tạo, cũng như là một trong những công ty công nghệ khởi nghiệp tăng trưởng nhanh nhất trong những năm gần đây. Nhưng ít nhất đến nay, cái tên mà Wu nổi tiếng hơn nhiều vẫn là người mà mọi người nhớ đến trong cộng đồng toán học và lập trình - tưởng nhớ đến cái tên mà mọi người không thể quên được, một cá nhân kiểu "Michael Jordan".
Anh lớn lên ở Baton Rouge, Louisiana, một nơi không phải là môi trường tiêu biểu cho việc nuôi dưỡng thiên tài công nghệ Mỹ, nhưng anh đã sớm nổi danh trong môi trường rèn luyện số học và lập trình áp lực cao. Anh là một trong những người Mỹ xuất sắc nhất từng giành huy chương vàng tại Cuộc thi Toán học Quốc tế (IOI), cũng như là một trong số rất ít những người để lại dấu ấn trong lịch sử cả với tư cách đồng đội, huấn luyện viên và kỷ lục thi đấu. Anh thích thách thức người khác trong trò chơi bài và cờ, cũng như trình diễn phép màu toán học với bộ bài. Nói cách khác, anh là loại thiên tài công nghệ gần như kiểu trong sách giáo trình.
Wu lần đầu tiên nổi tiếng trong cộng đồng người đồng trang lứa vào năm 2003. Lúc đó, anh chỉ là một học sinh lớp hai, nhưng lại đăng ký tham gia một cuộc thi toán học dành cho học sinh trung học. Một đứa trẻ 7 tuổi tham gia ở nhóm lớp bảy, anh nghĩ rằng tên mình sẽ được gọi trong buổi lễ trao giải, nhưng không có. 20 năm sau, khi nhớ lại kỷ niệm này, anh vẫn nhớ như in như Michael Jordan khi nói về mỗi lần bị coi thường trong sự nghiệp của mình.
Năm tiếp theo, anh tham gia cuộc thi ở nhóm lớp chín với tư cách học sinh lớp ba và giành được hạng nhất. Trước khi anh 17 tuổi rời khỏi trung học, anh đã giành được hạng nhất cả nước tại cuộc thi toán học dành cho học sinh trung học quan trọng nhất toàn quốc, và giành được chiếc huy chương vàng IOI đầu tiên trong ba chiếc của riêng mình. Đồng đội của anh lúc đó bao gồm Alexandr Wang, Johnny Ho và Jesse Zhang—sau này, họ lần lượt trở thành người sáng lập Scale AI, Perplexity và Decagon.
Eugene Wigner đã từng có một câu nói nổi tiếng: Dirac, Schrödinger, Taylor, thậm chí cả Einstein đều sẵn lòng công nhận rằng John von Neumann là người thông minh nhất trong số họ. Tương tự, các đồng đội IOI của Wu—trong mười năm sau khi cùng nhau giành HCV lần cuối cùng, tổng giá trị của các công ty do những người này thành lập đã đạt khoảng 800 tỷ USD—dường như cũng nhìn nhận anh theo cách tương tự.
Người đồng sáng lập Cognition, cũng là người giành HCV IOI Walden Yan từng nói: "Khoảng cách giữa Scott và tôi giống như khoảng cách giữa tôi và những người không đủ tư cách tham gia cuộc thi."
Xung quanh Wu, gần như mọi người đều có một câu chuyện về "thiên tài".
Người đồng sáng lập thứ ba của Cognition, cựu đồng đội IOI của Wu Steven Hao đã đưa ra cho Wu một bài toán dự thi toán Putnam, thách thức anh giải trong hai giờ bằng giấy bút. Kết quả là lúc Wu suy nghĩ to lớn, anh ta thậm chí không chạm vào cây bút, chỉ mất 90 giây để đưa ra lời giải.
Một lần khác, Wu đã tổ chức một trận cờ vua và bài phỏm thách thức với nhà đầu tư lớn nhất của mình Peter Thiel và Napoleon Ta, cố gắng thông qua bàn cờ và bài để đạt được điều khoản đầu tư tốt hơn cho công ty. Và còn về lời đồn trong cộng đồng IOI: cô gái mà gần như tất cả mọi người ngưỡng mộ, đã hầu như hẹn hò với người chơi cốt lõi của đội tuyển Trung Quốc, nhưng sau đó chọn Wu. Văn bản gốc đùa cợt: "Đầu hàng đi, đội Trung Quốc."
Một lần khác nữa, Founders Fund tổ chức một buổi tiệc LAN Super Smash Bros Melee. Khách mời đặc biệt là Mango, "vị thần năm" và cũng là một trong những người chơi Melee vĩ đại nhất trong lịch sử. Wu chưa bao giờ là một cao thủ trong trò chơi này, nhưng anh đã xuất hiện trong buổi tiệc đó và đánh bại Mango. Anh không dựa vào việc huấn luyện cấp chuyên nghiệp, mà dựa vào tốc độ phản ứng nhanh hơn, và sự đánh lừa giống như trong bài phỏm để đoán đúng.
Điểm quan trọng ở đây là, nếu ở một thời đại khác, một lập trình viên từ bờ đông sông Mississippi, tự lực cánh sinh, tính tình không phải dạng vừa, thành thạo nhiều kỹ năng, đam mê cạnh tranh và đôi khi mong muốn một trận "đánh nhau" như một nhà vô địch thi đấu trí tuệ toàn cầu, khi 29 tuổi, có lẽ đã bước vào cảnh thứ hai và thứ ba của câu chuyện truyền thống về thiên tài nhút nhát: một bên được hệ thống công nhận, một bên bắt đầu bị tài năng, cứng đầu và cô đơn của chính mình phản tác dụng.
Nếu anh ta là một người khác, có lẽ anh ta đã lên sóng chương trình "60 Minutes," cảnh báo công chúng rằng, nếu chính phủ không áp đặt một loạt chi phí giám sát gần như cấm kỵ đối với những đối thủ mới nổi, hoặc nếu anh ta không giành chiến thắng trong một vụ kiện quan trọng nào đó, công ty của anh sẽ tạo ra một khe hở không thể sửa chữa trên cấu trúc xã hội Mỹ.
Nhưng trong thực tế, Wu không chọn con đường ảo tưởng như vậy. Anh ta gần như im lặng xây dựng Cognition.
Sản phẩm mũi nhọn của Cognition, Devin, là một kỹ sư phần mềm AI tự hành: nó chạy trên máy chủ riêng của mình, có thể nhận nhiệm vụ lập trình, hiểu thư viện mã nguồn có sẵn, kiểm tra và gỡ lỗi công việc của chính nó, sau đó nộp yêu cầu kéo (pull request) để con người xem xét.
Nếu điều này nghe có vẻ nhàm chán đến gần như nhàm chán — một ý nghĩa nào đó thực sự như vậy — thì việc Cognition cũng trở thành một trong những công ty phát triển nhanh nhất trong lịch sử kinh doanh càng đáng chú ý hơn. Số lượt sử dụng của Devin tăng gấp đôi mỗi tám tuần, và trong 18 tháng đầu tiên kể từ khi dịch vụ ra mắt, doanh thu đạt 4,45 tỷ USD. Có khoảng bốn lý do chính đứng sau điều này.
Thứ nhất, Wu nhận ra sớm hơn hầu hết mọi người rằng ngành công nghiệp AI sẽ hội tụ vào hình thái tổ chức trí tuệ. Tương lai của AI không chỉ là một công cụ tự động hoàn chỉnh nữa, mà sẽ chạy ngầm 24/7, như một đồng nghiệp nhận nhiệm vụ đã được phân công.
Thứ hai, anh thấy rằng khả năng của các mô hình thời đại GPT-4 đã đủ để hỗ trợ việc xây dựng sớm những thực thể thông minh như vậy. Thời điểm đó, sự đồng thuận trong ngành vẫn cho rằng, một đại diện AI thực sự hữu ích vẫn cần vài năm nữa.
Thứ ba, khi bên ngoài vẫn nghi ngờ về việc liệu một thực thể AI có phù hợp với thị trường sản phẩm hay không, Wu lại cho rằng điều này không phải là vấn đề. Lý do rất đơn giản: thế giới này đã tiêu hàng trăm nghìn tỷ USD mỗi năm trên "máy tính thịt" — tức là lập trình viên phần mềm con người.
Thứ tư, anh ta sẵn lòng tung sản phẩm ra thị trường đủ sớm, và chịu đựng các phản ứng tiếp theo. Vào tháng 3 năm 2024, Wu ra mắt Devin. Lúc đó, nó chỉ đạt 13% trên SWE-Bench. SWE-Bench là một bài kiểm tra dành cho thực thể thông minh lập trình AI, dùng để đo lường mức độ thực thể có thể tự động sửa lỗi bao nhiêu phần trăm của các lỗi phần mềm. Kết quả này đã khiến nhiều lời chỉ trích công khai, nhưng Wu sử dụng thời gian dẫn đầu này để liên tục cải tiến, và cuối cùng, đã giúp Cognition xây dựng ưu thế dẫn đầu ngày nay.
Hiện nay, điểm số kiểm tra tiêu chuẩn tương ứng đã gần đạt 90% trên SWE-Bench gốc và gần đạt 80% trên SWE-Bench Pro. Devin cũng đã trở thành một đại lý lập trình trí tuệ nhân tạo được lựa chọn bởi các tổ chức như Lục quân Mỹ, Goldman Sachs, Mercedes-Benz, và các tổ chức khác. Một năm rưỡi trước, số lượng khách hàng của Cognition vẫn là không; hiện nay, công ty này đang được định giá khoảng 250 tỷ USD.
Khi Wu nói về Cognition, cũng như về trí tuệ nhân tạo rộng hơn, anh không hào hứng vẽ ra cảnh tận thế, cũng không nghiện mê vào câu chuyện thống trị công nghệ to lớn. Anh thường nói về việc làm thế nào để "mọi người có thể xây dựng phần mềm thực sự hữu ích một cách dễ dàng hơn".
Anh đề cập đến việc làm cho trang web của cơ quan quản lý xe cộ, cục thuế, bệnh viện, hãng hàng không, và trang web của trường tiểu học của con bạn, đều hoạt động mượt mà, trực quan như Instagram. Anh hy vọng trí tuệ nhân tạo có thể loại bỏ những chút không hiệu quả, cản trở và ma sát hệ thống mà chúng ta gặp phải trong cuộc sống hiện đại.
Như anh thích nói: "Nhờ đó, chúng ta có thể không còn sống trong chế độ sống sót của 'Thế giới của tôi' mà bắt đầu sống trong chế độ sáng tạo." Đối với một tay trùm trí tuệ nhân tạo, một "Hoàng đế mộc đầu" như anh, điều đó gần như là một mong muốn bình thường không ngờ.
Vậy, Cognition sẽ thành công chăng?
Có lẽ không. Có lẽ trí tuệ nhân tạo vốn là một thị trường tương hỗ, và việc thành lập một phòng thí nghiệm trí tuệ nhân tạo vào tháng 11 năm 2023 đã quá muộn đối với Wu. Có lẽ đây thực sự là một thị trường cạnh tranh đầy đủ, nhưng Cognition vẫn có thể bị áp đảo bởi một loại hỗn hợp nào đó do OpenAI tạo ra, Codex, Claude Code, hoặc kết hợp giữa xAI và Cursor. Có lẽ, việc dùng một siêu nhóm hoàn toàn bằng những người đam mê sách vở, gần như không có ai có dáng vẻ "vận động viên", để giành chiến thắng trong cuộc chiến này, chính là một lựa chọn không khôn ngoan.
Có lẽ, các đánh giá đầu của Devin không bằng ngày nay, điều này có thể ảnh hưởng tới sự đánh giá thị trường trong thời gian dài. Có lẽ điều này không quan trọng, nhưng cuối cùng, Cognition có thể vẫn sẽ từ bỏ tính độc lập như Cursor trước một trong các công ty mẫu lớn hơn hoặc công ty nền tảng. Hoặc, chúng ta có thể chỉ đang nói lại câu chuyện bong bóng kiểu NFT, và từ đầu tất cả đều không quan trọng.
Là một tác giả, và một người sưu tập một loại "bướm loài quý hiếm", gần đây tôi đã đến thăm trụ sở của Cognition tại San Francisco, và đã có một cuộc trò chuyện dài với Wu. Khi gặp anh, anh đã đưa cho tôi một con búp bê lông otter - đó là hình ảnh động vật hóa của Devin, tên gọi từ một trò chơi văn bản "dev-elop-in'".
Tôi nhắc đến một cách ngẫu nhiên rằng khi bước vào, tôi nhận thấy rằng không có ai trong công ty đang sử dụng phòng tập gym, có lẽ vì đó cũng là nơi công ty để rác ướt. Wu trả lời rằng họ đặt rác ướt trong phòng tập gym vì họ là các vận động viên thi học sinh giỏi toán học.
Tôi đặt công cụ phỏng vấn lên bàn, đợi người sáng lập kiêm CEO của Metronome, Kevin Liu, mang một hộp dâu đến cho Wu — anh ấy nói rằng những quả dâu này "sẽ thay đổi cuộc sống của bạn" — sau đó nhấn nút ghi âm.
Dưới đây là bản ghi văn bản của cuộc trò chuyện này. Cuộc trò chuyện kéo dài khoảng ba giờ, và nội dung đã được chỉnh sửa và nén để dễ đọc.
Jeremy Stern (Người dẫn chương trình): Scott, bạn hiện đang là một doanh nhân trí tuệ nhân tạo, và xung quanh bạn đã hình thành một huyền thoại cá nhân khá phong phú: bạn dường như giống như một máy tính hơn là một người thật; và bạn đã lớn lên trong một khu rừng lầy. Vì vậy, chúng ta hãy điều tra về quá khứ bạn một chút.
Scott Wu: Ba mẹ tôi đều đến từ Thượng Hải, họ đã lớn lên ở Trung Quốc. Trong một thời gian dài, hệ thống thi đại học thông thường của Trung Quốc không tồn tại. Đó là khoảng 10 năm. Ba mẹ tôi đúng lúc trải qua giai đoạn này, họ không chỉ không vào đại học, mà họ thậm chí chưa hoàn thành chuẩn bị ở cấp trung học và phổ thông.
Sau này, kỳ thi lại được mở cửa. Tự nhiên tình hình phát sinh là: những học sinh bị nén sau 10 năm, đều tiến hành cạnh tranh cho cùng một số lượng chỗ học đại học. Và vì họ thực sự chưa nhận được một hệ thống giáo dục hoàn chỉnh, mẹ tôi lúc đó vẫn đang làm việc tại một nhà máy dệt. Họ đi làm vào ban ngày, và học vào ban đêm để chuẩn bị cho kỳ thi, cuối cùng họ đỗ đại học. Họ học rất tốt.
Bố tôi rất thích cờ vua, anh có một giáo sư thường xuyên chơi cờ với mình. Sau đó, giáo sư kia đi sang Mỹ, viết thư cho bố tôi, nói rằng bố tôi nên đến Mỹ học đại học, nơi đó tốt hơn nhiều, cơ hội cũng nhiều hơn. Anh giúp bố tôi làm đơn xin vào trường và những thủ tục liên quan. Và sau đó bố tôi đến Mỹ trước, sau đó 6 tháng, mẹ tôi cũng đến. Họ sau này đều học ngành kỹ sư hóa học tại Đại học Tiểu bang Colorado.
Jeremy Stern: Họ có bàn về cú sốc văn hóa của thời điểm đó không?
Scott Wu: Đối với họ, chắc chắn rất khác biệt. Nhưng ít nhất ở phần nhà ở và thức ăn, Mỹ đã tốt hơn rất nhiều — những thứ đó vào thời bấy giờ ở Trung Quốc vẫn khá hiếm hoi. Họ rất biết ơn điều đó. Bố tôi luôn nói rằng, quyết định tốt nhất trong đời anh ấy là đến Mỹ. Tôi nghĩ đó là đúng.
Họ chưa bao giờ rời khỏi Trung Quốc trước đó. Thậm chí sau này cũng vậy — mẹ tôi mất cách đây vài năm, cả đời chỉ đi qua Trung Quốc và Mỹ. Bố tôi cũng vậy, cho đến khi năm ngoái tôi đưa ông đi Nhật Bản. Vì vậy, đương nhiên đó là một cú sốc văn hóa rất lớn.
Còn rất nhiều điều nhỏ nữa. Lúc đó Trung Quốc rất nghèo, họ đã tiết kiệm được một vài tháng tiền để đến Mỹ. Khi bố tôi mới đến Mỹ, ông chỉ có khoảng 80 đô la trên người. Ông kể cho tôi một câu chuyện: Ông và các sinh viên nghiên cứu khác đi taxi từ sân bay, mọi người tự nhiên đóng góp một chút tiền để tip. Khi ông rút ra một hoặc hai đô la làm tiền tip, ông bất ngờ nhận ra, đó gần như là 3% toàn bộ tài sản của mình. Khoảnh khắc đó đối với ông rất sốc và có chút ngượng.
Jeremy Stern: Đó là năm nào vậy?
Scott Wu: Năm 1989.
Jeremy Stern: Vậy nên, đó thực sự là một thời điểm rất đặc biệt: học ở Mỹ thay vì ở lại Trung Quốc. Sau đó, làm sao mọi người đến Baton Rouge? Đó cũng không giống như trải nghiệm của "Đảo Ellis" theo nghĩa truyền thống.
Scott Wu: Họ đều học kỹ thuật hóa học. Tự nhiên, vì Louisiana có ngành công nghiệp dầu khí lớn, họ sau đó đã tìm được việc làm ở đó. Bố tôi làm tư vấn về giấy phép chất lượng không khí, mẹ tôi làm việc tại bộ môi trường địa phương.
Tôi có một anh trai là Neal, lớn hơn tôi bốn tuổi. Tôi sinh năm 1996. Đến khi đó, chúng tôi đã có một ngôi nhà nhỏ, sống ở ngoại ô Baton Rouge trong một cuộc sống tầm trung khá tiêu biểu.
Từ bé, tôi rõ ràng khác biệt so với những người xung quanh. Họ có lẽ đều bình thường hơn tôi rất nhiều. Trong giờ giải lao, mọi người chơi đá bóng chẳng hạn, nhưng tôi chẳng bao giờ quan tâm. Tôi thích toán học và luôn cạnh tranh cao. Tôi nhớ nửa ba tuổi tôi đã bắt đầu học bảng cửu chương. Rất nhiều kiến thức toán học ban đầu thực sự đến từ việc tự nhiên học ở nhà.
Điều này cũng được củng cố bởi việc anh trai tôi lớn hơn tôi bốn tuổi. Chúng tôi có nhiều sở thích chung, tôi rất ngưỡng mộ anh ấy, vì ở Baton Rouge, Louisiana, những người như chúng tôi không phải là nhiều.
Jeremy Stern: Không có lý do đặc biệt khiến tôi nghĩ như vậy, nhưng khi còn nhỏ, bạn đã từng bị bắt nạt chưa?
Scott Wu: Chắc chắn, có. Tôi thường bị bắt nạt. Tôi thật sự khác biệt. Trước khi tôi bắt đầu gặp những người giống mình thông qua các cuộc thi, tôi hoàn toàn là một người khá cô đơn. Ở Baton Rouge, tôi có một số bạn thân, nhưng thành thực mà nói, ở một mức độ nào đó, tôi cảm thấy mình dường như đã lớn lên cùng với những người chơi toán học và lập trình từ khắp Mỹ, thậm chí cả thế giới. Vì họ giống với tôi hơn rất nhiều so với những người xung quanh.
Jeremy Stern: Tôi muốn bàn về cuộc thi sau. Nhưng trước hết, hãy nói về cách bạn thể hiện tình yêu của mình đối với toán học ngoài việc thách đấu với các bạn nhỏ trong giờ học nhân dân đã thuộc bảng cửu chương?
Scott Wu: (cười) Khi anh trai tôi học lớp sáu, tôi học lớp một. Lúc đó, anh ấy bắt đầu tiếp xúc với các cuộc thi toán học trung học. Tự nhiên, tôi cũng đi theo, muốn học toán. Và mọi thứ bắt đầu từ đó.
Lúc đó, tôi đang học tại Trường Tiểu học Buchanan, trong chương trình thiên tài của trường. Gần đó có một trường trung học gọi là McKinley. Từ lớp ba, tôi đã đến đó để học môn toán trung học. Trong vài năm, một giáo viên sẽ đến trường tiểu học hàng ngày để đón tôi, đưa tôi đến McKinley. Khi lên lớp năm, tôi bắt đầu tự đi đến đó. Hệ thống trường địa phương đã hỗ trợ rất nhiều: họ rất sẵn lòng hợp tác và tìm cách để mọi việc diễn ra một cách suôn sẻ.
Anh trai tôi chắc là đã dạy tôi lập trình khi tôi lớp bốn. Tôi thường chơi Pokémon trên máy mô phỏng, điều này cũng giúp tôi học lập trình thêm. Tôi cũng chơi Tetris. Và một trò chơi bài gọi là 24. Tất cả những trò chơi tương tự đều là logic, câu đố hoặc chiến lược, trong đó bạn có thể tính toán các lựa chọn khác nhau. Đó luôn là sở thích lớn nhất của tôi.
Ba mẹ thực sự kích động tôi học và luyện tập ở mức độ khá cao, nhưng sau đó, tôi đã bước vào giai đoạn tôi tự muốn làm mọi thứ. Tôi hoàn toàn tự động. Nếu bạn không thực sự quan tâm sâu sắc, rất khó để làm được điều đó. Tôi luôn yêu thích toán học, vì nó rất tinh tế. Tất nhiên, sự khuyến khích từ ba mẹ cũng rất hữu ích.
Jeremy Stern: Một đứa trẻ làm thế nào để cảm nhận được "tinh tế"?
Scott Wu: Tôi nhớ rằng ba tôi đã giải thích công thức bậc hai cho tôi. Ông viết trên một tờ giấy: Ax² + Bx + C = 0. Sau đó ông nói với tôi rằng nên xử lý như thế này: chia A ra khỏi, sau đó hoàn thiện, giải phương trình này, rồi cuối cùng có được B đổi dấu cộng trừ điều gì đó. Tôi rất thích quá trình này.
Tôi luôn yêu thích logic và thích dẫn dắt mọi vấn đề đến kết luận tự nhiên của nó một cách từng bước. Điều tuyệt vời nhất về toán học là nếu bạn thực sự hiểu sâu vấn đề, thì các vấn đề đó đều có ý nghĩa logic. Tất nhiên, vì tôi giỏi toán, nên tôi có thể đánh bại người khác, điều đó cũng không tồi. Và rõ ràng, tôi rất thích đánh bại người khác.
Jeremy Stern: Bạn nói "rõ ràng", nhưng lòng tự hào như vậy từ đâu mà ra?
Scott Wu: Hiện nay, tôi vẫn là người mạnh nhất trong gia đình, nhưng ba mẹ và anh trai tôi đều là những người có tinh thần cạnh tranh ở mức độ 99 phần trăm. Có lẽ mẹ tôi mới là người có tinh thần cạnh tranh mạnh nhất trong số chúng tôi, nếu tôi phải đoán.
Về Định Kiến về Phụ Huynh: Họ thường so sánh bạn với con của người khác, ví dụ như, "Con của gia đình X làm tốt hơn". Nhưng mẹ tôi luôn nói ngược lại. Ví dụ, "Đứa trẻ thông minh đó thực sự cũng không đến nỗi xuất sắc. Đứa con của người đó vào Princeton, nhưng thực ra không gây ấn tượng."
Bà luôn khuyến khích mạnh mẽ ý tưởng này cho tôi: bạn có tiềm năng để trở thành người tốt nhất. Bà chưa bao giờ nói, "Mọi người đều giỏi quá, bạn nên học họ." Bà hơn là nói: "Những điều họ có thể làm, bạn cũng có thể làm được."
Jeremy Stern: OK, chúng ta tiếp tục với so sánh này về Michael Jordan. James Jordan đã thiết lập một cái góc bóng rổ trong sân sau nhà ở Wilmington. Michael ban đầu thích chơi bóng chày, nhưng sau đó bắt đầu chơi bóng rổ đối mặt với anh trai Larry trong sân. Anh ngưỡng mộ Larry, đồng thời muốn đánh bại anh ta. Sau đó là khoảnh khắc quyết định cuộc đời anh: Michael ban đầu nghĩ rằng anh sẽ được vào đội trường, nhưng sau cuộc tập luyện, anh không được chọn. Hãy kể về một giai đoạn tương tự trong cuộc sống của bạn.
Scott Wu: (cười) Tôi không chắc liệu tôi chấp nhận giả định này hay không. Người chơi lập trình thi đấu mạnh nhất trong lịch sử chắc chắn là Gennady Korotkevich, anh ta hiện đang làm việc tại Cognition.
Jeremy Stern: Dĩ nhiên, nhưng "như Jordan" không chỉ là về những chiếc nhẫn vô địch. Đó còn bao gồm cả một cơ hội gia công giày trị giá hàng tỷ đô la, khả năng biến mọi chuyện nhỏ nhặt thành trò chơi cạnh tranh, nụ cười 1000 watt, và một bà vợ quyến rũ có nguồn gốc Cuba. Thêm vào đó, tôi nghĩ cô ấy từng làm người mẫu cho Alexander Wang. Tất nhiên, đó là Alexander Wang khác.
Scott Wu: OK. Lần đầu tiên tôi tham gia cuộc thi toán, là tại Đại học Nam Phương Bắc ở Baton Rouge. Đó là một cuộc thi dành cho học sinh trung học và trung học cấp hai - học sinh lớp 6 tham gia nhóm toán lớp 6, học sinh lớp 7 tham gia nhóm toán lớp 7, và cứ thế. Lúc đó, tôi đang học lớp 2, nhưng đã đăng ký tham gia nhóm toán lớp 7.
Tại buổi lễ trao giải, họ bắt đầu đọc tên các người đoạt giải. Tôi luôn tưởng rằng, vào một thời điểm nào đó, tôi sẽ nghe tên của mình. Nhưng không có. Lúc đó, tôi rất không chịu được. Thực sự, rất, rất không chịu được. Đến bây giờ, tôi vẫn nhớ điều đó. Đó là một trong những ký ức đầu tiên của tôi.
Cùng một cuộc thi, khi tôi vào lớp 3, tôi quay lại. Lúc đó tôi đã học Algebra 1, tức là đại số 1. Tôi tham gia nhóm lớp 9, nhớ rằng tôi dường như đạt điểm tối đa và giành hạng nhất. Từ khi còn rất nhỏ, tôi luôn muốn đánh bại tất cả mọi người. Đối thủ lớn tuổi hơn tôi không quan trọng.
Jeremy Stern: Như chúng ta đã xác nhận trước đó, khi bạn còn nhỏ thì thực sự đã bị bắt nạt.
Scott Wu: Khi tôi ở lớp hai thì thực sự không có nhiều bạn. Nhưng khoảng đến lớp sáu, tức là giai đoạn trung học cơ sở, tình hình bắt đầu thay đổi. Trong trường có một cuộc thi mang tên MathCounts. Những học sinh xuất sắc nhất trong trường sẽ tham gia vòng thi thành phố, người chiến thắng ở vòng thi thành phố sẽ tiến vào vòng thi bang, người chiến thắng ở vòng thi bang sẽ tiếp tục vào vòng thi quốc gia. Tổ chức sẽ đưa tất cả mọi người đến Disney World, chuyến đi kéo dài ba bốn ngày.
Ngay từ đầu cuộc thi, buổi sáng là phần thi giấy lớn. Tất cả mọi người ngồi trong một phòng lớn để thi. Sau đó, 12 người xếp hạng cao nhất sẽ tiến vào vòng thi Knockout, nơi họ sẽ thi đấu đấu 1v1.
Jeremy Stern: Đúng, đó là video nổi tiếng với cô bé tội nghiệp đó.
Scott Wu: Đúng vậy. Vì thế tôi đã tham gia vòng thi quốc gia, ở đó tôi đã gặp biết nhiều bạn khác. Sau đó, chúng tôi tiếp tục giữ liên lạc thông qua Google Hangouts. Khi vào trung học, mối liên hệ này vẫn tiếp tục. Những học sinh giỏi toán học và lập trình sẽ tham gia vào các trại hè khác nhau. Những người này sau này đã trở thành một phần lớn trong những người bạn thân nhất của tôi. Tôi chính là người khởi xướng Cognition cùng với nhiều người này.
Phần lớn họ, bạn có thể tưởng tượng, đến từ Cupertino hoặc khu vực lân cận Washington DC, học tại Thomas Jefferson, hoặc đến từ Stuyvesant ở New York. Tôi đến từ Louisiana, nhưng tôi vẫn cảm thấy mình giống họ hơn. Mối quan hệ của chúng tôi luôn rất chặt chẽ.
Do đó, tôi đã quen biết Jesse Zhang, Johnny Ho, Jeffrey Yan của Hyperliquid, và Alexandr Wang của Scale. Jeff là một trong những người bạn tốt nhất của tôi từ trung học đến đại học. Alexandr giống như một trong những người bạn tốt nhất của tôi từ khi ở trung học. Anh ấy đến từ tiểu bang New Mexico, từ góc độ này, chúng tôi có một chút tương đồng.

Scott Wu ở lớp ba giành chiến thắng trong cuộc thi toán cấp cấp 9. (2006)
Jeremy Stern: Tại sao bạn sau này chuyển từ "bóng chày" sang "bóng rổ"?
Scott Wu: Tôi luôn tham gia cả cuộc thi toán và lập trình, nhưng tôi mạnh mẽ hơn ở phần lập trình. Tôi thích cuộc thi lập trình hơn, và có một số lí do.
Đầu tiên, bản thân bài toán lập trình phù hợp hơn với sở thích của tôi. Trong toán học, tôi rất giỏi về xác suất, toán tổ hợp và vấn đề đếm. Những vấn đề này thực ra rất giống với trò chơi chiến lược: bạn phải tính toán các lựa chọn khác nhau, hiểu được cái gì dẫn đến cái gì. So với đó, các bài toán như hình học tôi cũng có thể làm, nhưng không thích bằng. Và rất nhiều vấn đề trong lập trình, bản chất đều gần với toán tổ hợp.
Điều thứ hai là, trong toán học có rất nhiều thuật ngữ. Ví dụ, ở đây phải dùng nguyên lý Pascal, ở đó phải dùng định lý Ptolemy, hoặc định lý khác. Điều thú vị là, đối với tôi, một đặc điểm luôn ổn định là: tôi chưa bao giờ nhớ tên những thứ đó.
Tôi luôn hiểu chúng ở mức độ trực giác hơn. Ví dụ, khi điều kiện này xảy ra, kết quả sẽ nhất định như vậy. Tôi thường không biết một thứ gọi là gì, cũng như không biết nó tương ứng với định lý nào. Đối với tôi, nó chỉ là một trường hợp cụ thể của một sự thật rộng lớn, phổ quát hơn.
Một ví dụ khác diễn ra ngày hôm qua. Lúc đó chúng tôi đang nghe một báo cáo nghiên cứu về huấn luyện cảm nhận lượng tử. Họ nói về nhiều thuật ngữ, tôi nói: 「Xin lỗi, tôi không biết đấy là những thuật ngữ gì. Nhưng theo bạn nói, thực ra là phải làm cái này trước, rồi mới làm cái kia, phải không?」 Tôi nghĩ, tôi luôn hiểu mọi thứ một cách trực giác hơn. Điều này thực sự khá bất thường.
Và lập trình còn có một đặc điểm rất rõ ràng: nó rất thực tế. Tôi nhớ khi tôi đang tập luyện cho cuộc thi MathCounts quốc gia, từng viết một chương trình tự viết ra các bài toán tính nhẩm khác nhau. Tôi sẽ chơi trò chơi do chính mình tạo ra và sử dụng nó để tập luyện. Nhận ra rằng mình thực sự có thể tự mình tạo ra điều gì đó, điều đó khiến tôi rất hài lòng.
Jeremy Stern: Vậy, bạn ba lần giành Huy chương Vàng tại IOI, sau đó trở thành HLV và người hướng dẫn cho các vận động viên trẻ, cũng như sở hữu một vòng bạn phân tán bao gồm các thiên tài toán học và lập trình. Sau đó từ thông tin của tôi, bạn đã nghỉ học từ trường trung học. Điều này có hợp pháp không?
Scott Wu: Nghiêm ngặt mà nói, tôi đã tốt nghiệp, chỉ là rời khỏi trường sau khi kết thúc năm học lớp 12. Luật lao động cho trẻ em ở California quy định, trước khi đầy 18 tuổi hoặc trước khi nhận bằng tốt nghiệp trung học, không thể làm việc toàn thời gian tại California. Lúc đó, tôi muốn làm việc ở vùng vịnh, vì vậy tôi đã tìm hiểu xem mình cần phải làm gì để nhận bằng tốt nghiệp. Sau đó, tôi thực hiện theo đúng như vậy.
Lưu ý: "New Budapest" là sự so sánh lịch sử của tác giả. Đầu thế kỷ 20, xung quanh Budapest đã từng xuất hiện một nhóm các nhà toán học, nhà vật lý người Do Thái Hungary rất xuất sắc; và ngày nay, có vẻ như lĩnh vực AI cũng đang xuất hiện một nhóm như vậy của các thiên tài công nghệ và doanh nhân.
Jeremy Stern: Một vấn đề luôn tồn tại: Tại sao rất nhiều nhà toán học và nhà vật lý vĩ đại nhất của thế kỷ 20 - những người sau này cùng làm việc tại Phòng thí nghiệm Los Alamos hoặc Khoa học Quy mô, hoặc đề xuất các mô hình cơ bản cho toán học, vật lý và kinh tế hiện đại - gần như đều là người Do Thái sinh vào khoảng thời gian 1900 ở Budapest và vùng lân cận? Tôi nhớ, Szilárd đã gọi tổng hợp họ là "Những Người Sao Hỏa".
Richard Rhodes trong cuốn sách về bom nguyên tử đã đoán, câu trả lời có lẽ là sự kết hợp của một nhóm yếu tố: sự hiện đại hóa nhanh chóng của Budapest, tầng lớp tư sản Do Thái đã tiêu biến nhưng vẫn bị cộng đồng truyền thống đưa ra khỏi cội nguồn, giáo dục tốt và những cuộc thi toán học, văn hóa quý trọng trí tuệ xuất sắc, di cư bắt buộc đến Đức rồi đến Mỹ, và cơ hội khoa học trong thời chiến. Giải thích này gần như nhàm chán đến mức khó tưởng tượng, nhưng tôi đoán là nó có thể chính xác.
Tôi vừa mới so sánh bạn với "Người Nhện Michael Jordan", nên không có ý định so sánh bạn và những người bạn của bạn với "Người Sao Hỏa" - ít nhất là tôi không nói như vậy trước mặt bạn. Nhưng tôi thực sự rất tò mò, làm sao để giải thích một nhóm người sáng lập như vậy: bạn cùng tham gia MathCounts và IOI, giữ liên lạc qua Google Hangouts, sau đó rời Harvard, tham gia hệ thống đào tạo của công ty định lượng, rồi nắm bắt cơ hội từ LLM; và đặc biệt, phần lớn bạn là người Mỹ gốc Á, sinh vào khoảng năm 2000.
Scott Wu: Tôi cũng thường suy nghĩ về vấn đề này. Trước hết, tôi nghĩ chúng tôi rất may mắn. Đối với tất cả chúng ta, điều tuyệt vời nhất có lẽ là được đứng trước bình minh của AGI. Tôi cho rằng, đây có lẽ thực sự là sự kiện có sức biến đổi lớn nhất trong lịch sử nhân loại. Ít nhất, nó chắc chắn là sự kiện quan trọng nhất mà thế hệ của chúng ta trải qua.
Tôi có vài ý tưởng.
Một trong số đó là, mọi thứ phát triển đến một giai đoạn nào đó, về cơ bản sẽ trở thành "Moneyball". Ví dụ như bóng đá. Trong những thập kỷ cuối thế kỷ 20, có rất nhiều cá nhân rất nguyên thủy trong giới bóng đá, mang một phong cách "trăm người trăm cảnh" kiểu Hollywood. Họ chơi bóng dựa vào trực giác cực kỳ sâu sắc đối với trò chơi. Tất nhiên, họ cũng phân tích, nhưng họ không phải như những người học đòi sách vở nghiên cứu cơ học xác suất.
Nhưng theo thời gian, bóng đá cuối cùng đã phát triển thành điều gì đó thực sự là toán học. Có rất nhiều toán học, và ngày nay nhiều nhà cược bóng đá hàng đầu thực sự là những "nhà toán học sách vở". Cờ vua cũng vậy, nhiều trò chơi tương tự cũng vậy.
Tôi cảm thấy, khởi nghiệp cũng đã trải qua một quỹ đạo tương tự. Cộng đồng trước có một hình ảnh nhà sáng lập kiểu Steve Jobs. Nhưng ngày nay, đặc biệt là trong lĩnh vực AI, một phần cũng bao gồm crypto, hình tượng nhà khởi nghiệp đã rõ ràng chuyển hướng sang một cái gì đó rất công nghệ.
Những công ty AI lớn mà mọi người đang nói về hiện tại, nhiều trong số đó đều do những người từ cộng đồng tương tự điều hành. OpenAI là một ví dụ. Ví dụ như Greg Brockman, anh ấy lớn tuổi hơn tôi một chút, nhưng đã tham gia vào tất cả các cuộc thi giống như chúng tôi. Anh từng là trong top 24 toàn quốc ở môn toán ở Mỹ, cũng tham gia đội tuyển hóa học Mỹ và đạt huy chương bạc ở cuộc thi Hóa học Olympic. Mark Chen, trưởng nhóm nghiên cứu của OpenAI, tôi đã cùng anh dạy đội tuyển IOI Mỹ. Jakub Pachocki, cũng chính là giám đốc khoa học của OpenAI, trước đây tôi thường thi đấu với anh ấy. Anh ấy đến từ Ba Lan, nhưng chúng tôi tham gia vào cùng một đợt cuộc thi quốc tế. Dario Amodei của Anthropic từng là thành viên của đội tuyển Vật lý Mỹ.
Nói tóm lại, thứ nhất, rõ ràng có một khả năng phân tích sâu có thể di chuyển được ở đây. Thứ hai, đặc biệt là trong lĩnh vực AI, dù tốt hay xấu, nền tảng kỹ thuật rất mạnh đã được chứng minh là rất có giá trị vì vấn đề bạn cố gắng giải quyết chính là vấn đề rất chuyên sâu về công nghệ.
Nhưng với thế hệ của chúng tôi, cũng có một yếu tố "lây nhiễm". Về điều này, tôi rất đồng ý với tác động của Alexandr Wang. Bởi vì anh thật sự là người đầu tiên trong nhóm của chúng tôi nói "Okay, tôi sẽ đi và thành lập một công ty". Vì quan hệ của chúng tôi rất chặt chẽ và chúng tôi hiểu lẫn nhau, nên cảm giác đó giống như: chúng tôi đều nên làm điều đó.
Khi tôi còn học cấp hai, tôi và Alexandr còn viết một tài liệu ý tưởng khởi nghiệp cùng nhau, tôi vẫn nhớ đến bây giờ. Những ý tưởng đó chắc chắn rất tệ, nhưng chúng tôi đã nghĩ, vào một ngày nào đó, chúng tôi sẽ thành lập một công ty.
Jeremy Stern: Okay, vậy làm thế nào có thể giải thích về thời điểm, và giải thích về trí tuệ. Trong lịch sử công nghệ, không phải mỗi giai đoạn đều có sự "tôn thờ trí tuệ" như vậy; nhưng AI thực sự có một số đặc điểm nào đó, khiến cho những người làm ra tiến triển quan trọng trong lĩnh vực AI, như Noam Shazeer, đa phần cũng là nhà vô địch thi toán học.
Có lẽ phần này về trí tuệ, cũng giải thích về khả năng suy luận từ nguyên lý đầu tiên. Ví dụ như có khả năng nhìn xa hơn theo một cây quyết định: mô hình sẽ đi đến đâu, hoặc không đi đến đâu nhiều; quy mô và học tăng cường sẽ hoạt động như thế nào; dữ liệu và công suất tính toán sẽ thay đổi như thế nào, và vân vân. Tôi có thể hiểu điều đó.
Nhưng nó vẫn chưa giải thích được phần khác: bạn vẫn phải là một người lãnh đạo. Bạn phải có khả năng thu hút những người rất thông minh khác. Trong một vũ điệu toàn bộ, bạn phải rõ ràng là con búp bê chính. Trong ảnh chung, bạn phải trông như là được chiếu sáng bởi một vòm sáng khác. Bạn cũng cần có trực giác sản phẩm và khả năng giữ mối quan hệ với con người.
Nếu mỗi năm có khoảng 25 vận động viên huy chương vàng như vậy, và chúng ta giả định cửa sổ thời gian thực sự liên quan là 10 năm, thì trong hàng tỷ người trên Trái Đất, đó chỉ là một hồ bơi có vài trăm người. Nhưng hầu hết mọi người trong đó, thậm chí không có tính cách sáng lập, chưa kể việc sở hữu đồng thời nhiều kỹ năng.
Vì vậy, tôi vẫn rất tò mò về điều này với người Mỹ gốc Trung Quốc. Bởi vì cho đến gần đây, điều đó chưa phải là sự thật. Tôi đang cố gắng tránh cái câu trả lời rõ ràng đó — tôi sẽ mập mờ đối chiếu nó với người Do Thái và Hollywood, hoặc ngành ngân hàng.
Scott Wu: Bạn dường như đang cố gắng khiến tôi trở nên như một kẻ tự mãn kiêu ngạo.
Jeremy Stern: Đó là vấn đề của tôi, không phải của bạn. Tôi cam đoan không ai sẽ nhầm lẫn điều đó.
Scott Wu: Tôi nghĩ, quan điểm của tôi về vấn đề này là, trong lĩnh vực của chúng ta, hai phẩm chất thực sự quan trọng là trí tuệ và lòng đam mê.
Những thứ bạn vừa đề cập, tất cả đều phát ra từ hai đặc điểm cơ bản này. Và những người được lựa chọn từ cộng đồng thi đấu chính là những điều này: thứ nhất, bạn rất thông minh; thứ hai, bạn rất nổi giận, muốn đánh bại tất cả mọi người.
Nếu bạn đủ thông minh, có thể liên tục phân tích, điều chỉnh, suy nghĩ về những điều bạn đã làm sai, và làm tốt hơn trong lần tiếp theo; đồng thời, bạn có động lực mạnh mẽ đủ để làm như vậy ngày hôm sau, không ngừng, trong nhiều năm. Tôi nghĩ rằng nói chung, bạn sẽ trở nên xuất sắc ở những khả năng dưới hơn này.
Về phần người Mỹ gốc Trung Quốc, một phần chính là sự lan truyền nhiễm trùng mà tôi đã đề cập trước đó. Chúng ta thực sự rất, rất may mắn khi có nhau. Nhiều người thực sự không nhận ra, khởi nghiệp cũng là một lựa chọn cho họ. Tôi chỉ cảm thấy rằng, chúng ta rất may mắn khi được trải qua quá trình này cùng nhau, và nhìn thấy nhau nở hoa thành công.
Jeremy Stern: Tôi đã bắt đầu nói xa dần. Chúng ta hãy nhanh chóng một chút. Khi bạn 17 tuổi, bạn đã đến California, đó là vào năm nào?
Scott Wu: Năm 2014.
Jeremy Stern: Đúng, vì theo luật California, bạn vẫn được tính là "lao động trẻ" vào thời điểm đó, nhưng bạn đã giành được bằng tốt nghiệp trung học, thỏa điều kiện miễn giảm, vì vậy Addepar mới có thể thuê bạn. Bạn đã làm việc ở đó một thời gian, sau đó đi cùng những "người ngoài hành tinh" khác đến HRT (Hudson River Trading), sau đó vào Harvard, rồi nghỉ học, thành lập LunchClub, rồi cuối cùng là Cognition. Trong gần mười năm đó, điều gì khiến bạn ấn tượng nhất?
Scott Wu: Đúng vậy. Tôi đã quen biết Vlad Novakovski thông qua Johnny Ho. Lúc đó, Vlad đang giữ chức vụ Phó Tổng Giám Đốc Kỹ Thuật tại Addepar. Tôi là một kỹ sư phần mềm tại Addepar, chịu trách nhiệm chủ yếu về kỹ thuật hiệu suất và tinh chỉnh.
Addepar có nhiều tính năng phân tích tài chính, cần phải tính toán các loại dữ liệu cho khách hàng và các công ty quản lý tài sản. Một phần lớn công việc mà tôi đã làm là để làm cho các tính toán này chạy nhanh hơn. Trong hơn một năm ở đó, tôi đã làm cho một số chỉ số cụ thể chạy nhanh hơn khoảng 100 lần.
Tôi cũng dành nhiều thời gian cho việc tuyển dụng. Trong năm đó, tôi có thể đã là một trong những người phỏng vấn xếp hạng thứ hai hoặc thứ ba của công ty, thường xuyên tham gia các sự kiện tuyển dụng tại MIT. Tất cả các ứng viên đều lớn tuổi hơn tôi, nhưng tôi vẫn đứng đó và giải thích với họ: "Các bạn thực sự nên đến làm việc tại Addepar vì những lí do này."
Jeremy Stern: Và vào thời điểm đó, ý thức kinh doanh của bạn như thế nào?
Scott Wu: Bằng không.
Quá nhiều thời gian trong cuộc đời tôi đã dành cho toán học và lập trình. Tôi có thể làm ra những thứ, nhưng khi nói về việc hiểu cách thế giới này hoạt động, tôi gần như không có bất kỳ kinh nghiệm nào. Tất cả mọi thứ đều bắt đầu từ việc học từ con số 0.
Sau đó, tôi rời Addepar, đến Harvard, ở đó khoảng hai năm. Tôi học chuyên ngành kinh tế, điều đó khi nhớ lại là khá buồn cười. Tôi thực sự có một chút cảm giác rằng mình sẽ không tốt nghiệp. Tôi đã học một khóa về viết văn, một khóa về diễn thuyết công cộng, một khóa triết học, và một khóa máy tính. Nhưng thực sự thì tôi không quan tâm đến bộ môn giáo dục truyền thống của trường.
Trước ngày thi cuối kỳ tại Harvard luôn có một tuần học, mọi người sử dụng thời gian đó để hoàn thành bài luận, ôn tập cho kỳ thi. Nhưng với tôi, hoàn toàn không quan trọng. Suốt cả tuần đó, tôi chỉ gặp gỡ và trò chuyện với các người khác, cùng họ chơi. Rất nhiều người suốt tuần đó chỉ biết học, hầu như không thấy ai. Đối với nhiều người trong số họ, tôi là người duy nhất nghỉ ngơi ra khỏi học tập trong tuần đó.
Sau đó, tôi bỏ học, chuyển đến San Francisco, và cùng Vlad thành lập LunchClub. Đó là mùa hè năm 2017. Chúng tôi hoàn thành vòng gọi vốn tiền khởi nghiệp, lúc đó đang làm việc tại chương trình ủy thác South Park Commons (SPC).
Ý tưởng ban đầu được gọi là Elliot Technologies, là một ứng dụng để sắp xếp lịch trình, xác định bạn nên gặp ai hoặc tạo liên lạc. Sau đó, chúng tôi đã thực hiện nhiều sự chuyển đổi dần dần. Nó không còn chỉ là việc gặp gỡ cá nhân, mà hướng đến mạng xã hội chuyên nghiệp hơn; cũng không còn chỉ là lên lịch trình, mà là giúp bạn xác định bạn nên gặp những người mới nào. Mọi thứ dần dần trở thành LunchClub.
Đó là một trải nghiệm rất thú vị. Chúng ta đã cùng điều hành công ty này khoảng năm năm, đã tổ chức hàng triệu cuộc gặp mặt, và đội ngũ đã tuyển dụng tối đa khoảng 30 người. Thật sự có một nhóm nhỏ người rất thích LunchClub, họ thích việc liên tục gặp gỡ người khác và xây dựng mối quan hệ mới.
Sau đó, đã xảy ra rất nhiều chuyện. Đầu tiên là dịch bệnh COVID, điều này đặc biệt đối với một sản phẩm thúc đẩy các cuộc gặp trực tiếp. Sau đó, đến một giai đoạn nào đó, việc tăng trưởng và thương mại hóa cũng trở nên khó khăn hơn. Đồng thời, vào thời điểm đó, mẹ tôi bắt đầu mắc bệnh nặng từ năm 2020. Tôi đã rời khỏi LunchClub vào tháng 6 năm 2022.
Jeremy Stern: Cô ấy qua đời vào lúc nào?
Scott Wu: Tháng 10 năm 2023.
Jeremy Stern: Khi tôi hỏi người khác về bạn, bên cạnh cuộc đua, mánh bài và Cognition, điều này thường là điều họ nhắc đến đầu tiên.
Scott Wu: Bà ấy được chẩn đoán mắc ung thư phổi giai đoạn 4. Bà đã dùng một loại thuốc định đề mục tiêu được vài năm. Sau đó, xuất hiện các biến chứng và vấn đề khác.
Jeremy Stern: Nhưng mọi người nhắc đến, không chỉ bà ấy đã qua đời, mà là bạn đã chuyển về nhà chăm sóc bà. Bạn tự chăm sóc bà.
Scott Wu: Điều đó có lẽ là... đó là một trong những sự kiện quan trọng trong cuộc đời tôi. (Giật mình)
(Giật mình) Sau đó, tôi đã chuyển về Louisiana. Trong suốt thời gian lớn hầu hết của đại dịch COVID, tôi đã ở đó và bên cạnh bà trong suốt thời gian đó. Tôi đã ở nhà hơn một năm. Trong một số ý nghĩa, COVID đã mang lại một món quà lớn cho tôi và anh trai, vì nó đã đưa cho chúng tôi cơ hội thực sự ở bên cạnh cha mẹ trong thời gian đó.
Vào năm 2021, khi thế giới bên ngoài bắt đầu mở cửa trở lại, tôi bắt đầu dành nhiều thời gian ở nơi khác. Tôi đã ở Miami trong một thời gian, sau đó đi đến New York. Vào cuối năm 2023, khi tình hình sức khỏe của mẹ tôi trở nên tệ hơn rõ rệt, tôi đã quay trở lại nhà.
Tổng体 là một thời kỳ rất đặc biệt. Với tôi, một phần lớn trong đó là tìm hiểu xem mình thực sự muốn từ cuộc sống. Tôi đã thành công với công ty đầu tiên, nhưng không phải là một thành công lớn lao. Tôi đã nghỉ ngơi một thời gian, khám phá nhiều ý tưởng khác nhau. Đồng thời, tôi cũng đã chăm sóc mẹ.
Toàn bộ quá trình rất mạnh mẽ về mặt cảm xúc. Nhưng đó cũng là một thời gian thích hợp để suy ngẫm: tôi đánh giá cái gì, tôi quan trọng cái gì, và tôi muốn công việc cuộc đời của mình là gì.
Jeremy Stern: Bạn đã khám phá những ý tưởng nào vào thời điểm đó?
Scott Wu: Tôi và Steven Hao, Andrew He đã thử nghiệm nhiều thứ và thông qua đó hiểu được thế giới này. Trong Crypto có một số hướng thú vị, chúng tôi đã học được về thị trường thông qua đó. Lĩnh vực bảo mật cũng có một số vấn đề đáng khám phá, như chứng minh không cần biết.
Sau đó, ChatGPT đã được phát hành vào tháng 11 năm 2022. Đến nửa cuối năm đó, chúng tôi đã dành rất nhiều thời gian để nghiên cứu sâu hơn về trí tuệ nhân tạo, nghiêm túc suy nghĩ về những gì công nghệ này sẽ phát triển tiếp theo.
Nhưng tôi gần như coi thời gian đó như một kỳ nghỉ, vì tôi cũng dành nhiều thời gian để ở bên cạnh mẹ. Mẹ tôi qua đời vào ngày 6 tháng 10 năm 2023. Một tháng sau đó, chúng tôi thành lập Cognition.

Cognition đặt tại vùng Berkeley của California. (Ngày 25 tháng 11 năm 2025)
Jeremy Stern: Một mặt, khi xem xét toàn bộ quá trình cuộc đời của bạn, việc huấn luyện phe chủ chốt AI của chúng tôi trong lập trình dường như là điều bạn định làm khi đến thế giới này. Mặt khác, mọi thứ dường như đầy ngẫu hứng. Tôi nghĩ ở một khía cạnh nào đó, chúng ta mỗi người đều như vậy. Nhưng bạn hiểu mối quan hệ giữa hai điều này như thế nào?
Scott Wu: Tất nhiên tôi có thể kể một phiên bản nhìn lại sau sự kiện, nói rằng toàn bộ câu chuyện là điều được ý thức từ trước. Nhưng tôi không nghĩ rằng đó hoàn toàn là sự thật.
Điều thực sự diễn ra là, chúng tôi đang khám phá trí tuệ nhân tạo tạo ra. Ngay sau khi ChatGPT được phát hành, mọi người đều đang thảo luận về nhiều ứng dụng khác nhau. Lúc đó, hầu hết mọi người đều quan tâm đến việc hoàn thiện văn bản. Mô hình tư duy tự nhiên nhất là: điều này được huấn luyện trên toàn bộ Internet, vì vậy nó nên có thể hoàn thiện những gì một người trên Internet sẽ nói. ChatGPT cũng chỉ là một hệ thống hỏi đáp, giống như hiện tại.
Jeremy Stern: Bạn thật trơ tráo.
Scott Wu: Nhưng một cách tự nhiên, ngay từ đầu, một trong những hướng thú vị mà chúng tôi rất quan tâm là lập trình, vì chúng tôi đều là lập trình viên. Và dạy AI viết code, có lẽ là điều tuyệt nhất mà bạn có thể thử.
Vào cuối năm 2023, có một thời điểm, mọi người bắt đầu thấy rằng Học reinforcement đang bắt đầu phát huy tác dụng. Tôi coi đó là sự khởi đầu của thời kỳ thứ hai của Trí tuệ nhân tạo. ChatGPT là thời kỳ đầu tiên, nhưng nó tương đối cơ bản hơn.
Jeremy Stern: Ngoài việc bạn quen biết nhiều người trong phòng thí nghiệm, bạn làm sao biết Học reinforcement đang phát huy tác dụng?
Scott Wu: Đúng vậy, có lý do đó, nhưng tôi cũng luôn theo dõi các nghiên cứu liên quan và bạn có thể thấy điều đó từ các bài báo.
Đó là một hiện tượng rất thú vị trong lĩnh vực Trí tuệ nhân tạo. Trước đây, mọi người sẽ công bố gần như tất cả các kết quả nghiên cứu. Nhưng vào tháng 11 năm 2022, khi mọi người nhận ra rằng công nghệ này có thể mang lại giá trị kinh doanh cao, tình hình này gần như ngay lập tức dừng lại. Tuy nhiên, bạn vẫn có thể thấy một số nghiên cứu huấn luyện mô hình xung quanh các nhiệm vụ như toán học, mã nguồn, v.v.
Vào thời điểm đó, có một số bài báo rất thú vị. Để nói một cách đơn giản, bước tiếp theo hình như khá rõ ràng theo logic, chỉ là bước đó không được công bố rộng rãi. Vì vậy, chúng tôi bắt đầu trao đổi với một số người, để hiểu rõ hơn vấn đề này. Sau đó, chúng tôi dần dần đưa ra một quyết định: Trí tuệ nhân tạo sẽ trở nên rất mạnh mẽ trong các nhiệm vụ suy luận logic như vậy. Vậy sau đó sẽ xảy ra điều gì?
Đó chính là hạt giống của Cognition.
Nhưng điểm khởi đầu thực sự là vào ngày 17 tháng 11 năm 2023, cũng chính là ngày Sam Altman bị sa thải khỏi Hội đồng quản trị OpenAI.
Jeremy Stern: Tại sao sự việc đó lại mang lại sự khác biệt?
Scott Wu: Ngày đó, tôi đang ở New York và đi ăn trưa với một số người. Lúc đó tôi đang thảo luận về một ý tưởng: khả năng suy luận đang tăng rõ rệt, Học reinforcement bắt đầu hiệu quả, và bây giờ có thể là thời điểm lý tưởng để thành lập một phòng thí nghiệm mới.
Thời điểm đó, ý tưởng đó vẫn rất chưa rõ về nghiên cứu. Chúng tôi vẫn chưa có quyết định rõ ràng về sản phẩm sẽ là gì, mô hình kinh doanh sẽ như thế nào. Và sau đó vào buổi chiều, Sam bị sa thải. Chúng tôi tự nhiên nghĩ: Okay, nếu có thời điểm nào thật sự thích hợp để làm điều này, có lẽ đó chính là lúc này.
Thực ra, chúng tôi đã có kế hoạch và có khả năng rằng chúng tôi sẽ làm điều đó. Nhưng sự việc đó trở thành một động lực tuyệt vời, một tia lửa bên ngoài, khiến chúng tôi phải tăng tốc độ, và cần phải đối diện nó một cách nghiêm túc. Đôi khi, khởi nghiệp đòi hỏi những khoảnh khắc như vậy: một khoảnh khắc khiến bạn hoàn toàn đắm chìm vào đó, khiến bạn nói, okay, chúng tôi đã từng khởi nghiệp trước đây, và cũng từng làm người sáng lập, nhưng lần này khác biệt. Lần này lớn hơn. Lần này là điều mà chúng tôi sẽ làm suốt đời.
Do đó, chúng tôi đã bay đến vùng vịnh, tổ chức một buổi hackathon. Chúng tôi đã gửi email, tin nhắn cho một nhóm người mà chúng tôi quen biết, đang làm về trí tuệ nhân tạo. Chúng tôi nói, "Hey, chúng tôi đang triển khai dự án này, hãy đến và cùng chúng tôi hack, cùng khám phá, xem chúng ta có thể làm được gì cuối cùng."
Căn nhà đó nằm ở Berlin Game, California.
Jeremy Stern: Thị trấn Berlin Game này được đặt tên theo một sứ mệnh của Abraham Lincoln được gửi đến Trung Quốc. Ông đã tham gia đàm phán để ký một hiệp ước, hủy bỏ các hạn chế đối với di cư từ Trung Quốc sang Mỹ.
Scott Wu: Đúng vậy, điều đó rất thú vị. Hiện tại, chúng tôi có một phòng họp ở đây, được đặt theo địa chỉ của căn nhà trước kia.
Chúng tôi ở đó khoảng hai tuần. Thời gian đó chính là dịp Lễ Tạ Ơn. Ban đầu, tôi dự định sẽ ăn Tạ Ơn cùng bố, vào lúc đó chỉ cách ngày mẹ tôi qua đời vài tuần. Nhưng lúc đó, tôi cảm thấy rằng tôi phải làm điều này ngay bây giờ. Chúng tôi cần phải thực hiện nó. Vì vậy, tôi đã hủy bỏ kế hoạch ban đầu.
Kết quả, việc ấy đã biến một cái Tạ Ơn mà có thể ăn cùng bạn bè, viết code cùng nhau, trở thành một điều khá tốt đẹp.
Sau đó, vào tháng 12, chúng tôi đã tổ chức một buổi hackathon khác. Sau đó, chúng tôi tiếp tục điều này cho đến khi nó thực sự trở thành một công ty. Trên thực tế, không chỉ dừng lại ở việc thành lập công ty, mà đi xa hơn nữa so với thời điểm đó. Chúng tôi vẫn duy trì hoạt động của căn nhà đó, cho đến tháng 1 năm nay.

Ảnh: Andria Lo
Jeremy Stern: Khi nào các bạn quyết định Devin cuối cùng sẽ trở thành dạng như thế nào?
Scott Wu: Chúng tôi luôn nhìn nhận nó dưới hình thức "đồng nghiệp".
Dĩ nhiên, có rất nhiều khác biệt giữa đồng nghiệp trí tuệ nhân tạo và đồng nghiệp con người. Nhưng thậm chí cả hai năm trước — lúc đó có thể nói rằng chúng tôi còn quá sớm với khái niệm này — điều đó vẫn luôn là quan điểm của chúng tôi. Nó nên là một thực thể trí tuệ hoàn chỉnh, có máy riêng, có thể tự hoàn thành công việc, có thể chạy trong cùng một hệ thống, sẽ xuất hiện cùng bạn trên Slack, cũng sẽ xuất hiện cùng bạn trên Jira hoặc các công cụ khác, và sau đó hợp tác với bạn như một đồng nghiệp.
Ngay cả cái tên cũng vậy. Chúng tôi đã quyết định gọi nó là Devin, thay vì đặt cho nó một cái tên giống như công cụ, vì có lý do. Chúng tôi luôn xem nó như một thực thể độc lập có thể tự thực hiện công việc.
Theo thời gian, điều này ngày càng trở nên thực tế đối với chúng tôi. Hai năm trước, điều đó chỉ là một ước mơ. Trong việc sử dụng hàng ngày, rõ ràng bạn vẫn cần hướng dẫn từng bước cho Devin rất nhiều. Nhưng mà trung thực mà nói, chúng ta đã đạt đến một giai đoạn: bạn thực sự có thể coi đó là một đồng nghiệp để cộng tác.
Một ví dụ cụ thể là, đến nay, có một phần khá lớn của các phiên Devin, bất kể là bên trong tổ chức chúng ta hay bên khách hàng, không còn được khởi động bởi con người mà được thực hiện tự động.
Một số phiên Devin được khởi động bởi điều kiện kích hoạt cụ thể; trong khi một số khác Devin tự chạy theo chu kỳ, liên tục tìm kiếm hành vi nào đó, hoặc phát hiện ra các vấn đề trong sản phẩm dường như không đúng, sau đó tự chỉnh sửa. Điều đó có nghĩa là, Devin không chỉ có thể hoàn thành nhiệm vụ bạn giao cho nó, mà thực tế nó còn tự tìm kiếm những nhiệm vụ mà nó cần thực hiện.
Jeremy Stern: Làm sao bạn đánh giá một hệ thống thông minh hoặc mô hình, đã thực sự trở nên tốt hơn và hữu ích hơn trong thực tế, chứ không phải chỉ là đã được tinh chỉnh cho các bài kiểm tra và chuẩn mực? Sau cùng, khi một mô hình đủ thông minh, các bài kiểm tra chuẩn mực sẽ trở nên dễ dàng, và mô hình cũng sẽ học được cách "lách" qua các bài kiểm tra. Chúng ta đã từng thấy những người có khả năng suy luận kém, không mạnh mẽ, nhưng điểm SAT của họ rất cao. Với tư cách là một vận động viên thi cử, bạn có thể đã suy nghĩ về vấn đề này.
Scott Wu: Ngay khi mô hình ngôn ngữ bắt đầu vượt qua chúng ta trên AMC (Cuộc thi Toán học Mỹ), điều tiếp theo trở nên rõ ràng hơn. AMC là một cuộc thi toán rất khó của trung học tại Mỹ.
Như bạn đã nói, hiệu suất trong một môi trường hộp cát và sự thực tế của việc làm việc trong thế giới thực sự, rõ ràng tồn tại sự khác biệt lớn. Tuy nhiên, tôi không coi đó là một ứng dụng trực tiếp, mà hơn như một minh chứng cho việc "những điều gì có khả năng".
Để giải quyết một số vấn đề rất khó khăn đó, bạn cần phát triển ra khả năng suy luận logic cơ bản rất lớn, sự sáng tạo, và khả năng kết nối một chuỗi suy luận rất dài và đảm bảo mỗi bước đều cần phải thẳng hàng. Biết được mô hình có thể thực hiện những điều đó dưới sự tập trung mạnh mẽ và dữ liệu huấn luyện đúng, đã rất rõ ràng chỉ ra rằng nhiều nhiệm vụ thực tế cũng có thể hoàn thành.
Việc này có lẽ đã bắt đầu từ đầu năm 2024, khi mô hình bắt đầu hiện thực hiện rất tốt trên các câu hỏi toán học loại này. Trong hai năm qua, bạn thường xuyên thấy là cùng một bộ công nghệ đã được ứng dụng rộng rãi.
Tôi muốn đặc biệt chỉ ra một điều: Tôi không nghĩ rằng trong hai năm qua, có bất kỳ bước đột phá lớn nào về tỷ lệ tập trung, hoặc thậm chí về học tăng cường chính mình. Thực tế, thay vào đó, những thay đổi thực sự đã xảy ra trong các loại khác.
Một trong những yếu tố quan trọng là quy mô: càng nhiều sức mạnh tính toán, càng nhiều dữ liệu. Nhưng ngoài ra, rất nhiều công việc thực sự đang tập trung vào việc giải quyết các vấn đề thực tế mà mọi người trên khắp thế giới đều phải đối mặt mỗi ngày; cách đào tạo mô hình theo những tiêu chí đó; cách làm cho mô hình hiểu rõ điều gì là tốt và điều gì là không tốt trong một nhiệm vụ cụ thể; sau đó triển khai nó vào thế giới thực và xây dựng trải nghiệm sản phẩm thực sự có thể đưa người dùng đến đó.
Trong hai năm qua, những công việc hỗn loạn, cụ thể và thực tiễn này đã thúc đẩy sự bùng nổ của việc sử dụng AI thực tế và mang lại giá trị từ AI cho mọi người. Sự quan trọng của nó vượt xa bất kỳ bước tiến nào chỉ là ở mức kỹ thuật học thuật mà không đi sâu vào thực tiễn.
Jeremy Stern: Khi nào mô hình thông minh mới không còn gặp phải những sự không ổn định? Khi nào chúng sẽ ngừng mắc những lỗi ngốc nghếch đó?
Scott Wu: Có thể nói như vậy: Tôi nghĩ chúng sẽ luôn gặp những khía cạnh không ổn định, nhưng sẽ đạt đến một cấp độ nơi sự không ổn định đó bắt đầu chồng lấn với khả năng của con người.
Điều này rất hợp lý. Bởi vì nếu bạn hỏi, con người đã được đào tạo để làm gì, đó và mô hình là rất khác nhau. Do đó, điều dễ dàng dự đoán là chúng sẽ có phân phối khả năng khác nhau. Ví dụ rõ ràng nhất có lẽ là khác biệt giữa làm việc trong thế giới vật lý và thực hành công việc tri thức, tư duy trừu tượng.
Các mô hình đã được đào tạo trên tất cả các token trên Internet, vì vậy chúng hiển nhiên sẽ hoạt động tốt hơn trước hết trong công việc tri thức. Trong khi con người phải học đi và nói. Có nhiều tế bào thần kinh hơn của chúng ta cũng đã được đầu tư vào những vấn đề như thế. Vì vậy, tôi nghĩ rằng sự không ổn định đó sẽ tiếp tục tồn tại.
Một vấn đề thú vị ở đây: Mô hình có thể vẫn không ổn định so với con người, nhưng ở những khả năng mà con người đã tiến gần đến hoàn hảo, mô hình có thể làm tốt như con người, thậm chí là tốt hơn một chút không? Ở những khía cạnh này, chúng ta đã gần đến giới hạn lý thuyết. Trong khi ở những khía cạnh khác, con người không hẳn sinh ra với mục đích đó, nhưng máy tính đã được tinh chỉnh và đào tạo để làm rất tốt.
Thú vị là, về lập trình và toán học, từ một khía cạnh nào đó, con người thật sự có thể giải được bài toán toán học, điều đó đã là điều kỳ diệu. Tôi không biết trong kinh nghiệm sống của người muối, điều nào đã dạy cho chúng ta sự quan trọng của việc giải bài toán toán học. Nhưng khả năng đó thật sự tồn tại.
Đằng từ điều này, mô hình tập trung vào lập trình có thể được đào tạo để làm tốt hơn con người, có lẽ không ngạc nhiên. Cuối cùng, lập trình chính là việc trò chuyện với máy tính, chỉ cho nó biết nên làm gì. Từ góc độ này, lập trình đã trở thành trường hợp sử dụng AI đầu tiên vĩ đại, không phải là điều quá đà. Nhưng điểm chính của tôi là điều này: Điều này hầu hết chỉ làm rõ sự thông minh của con người, chứ không phải là sự thông minh máy tính.
Jeremy Stern: Tôi đã nghe nhiều người trong ngành nói rằng mọi thứ sẽ hướng tới sự hội tụ: các công ty mô hình bước vào tầng ứng dụng, các công ty tầng ứng dụng bắt đầu xây dựng các mô hình tiên tiến. Vậy điều gì ngăn bạn trở thành một công ty mô hình?
Scott Wu: Theo tôi, đối với một công ty, sự tập trung là rất quan trọng.
Bạn có thể có các chức năng khác nhau, các hướng dẫn khác nhau. Nhưng theo tôi, bạn chỉ có thể có một mục tiêu. Bạn không thể vừa cố gắng làm điều này, làm điều kia, đồng thời lại cố gắng giải quyết một vấn đề nghiên cứu cơ bản nào đó.
Nếu bạn hỏi mục tiêu duy nhất của Cognition là gì, tôi sẽ nói, đó là làm cho mọi người trên toàn thế giới có thể xây dựng phần mềm một cách dễ dàng hơn. Đó là mục tiêu mà chúng tôi theo đuổi, và tôi nghĩ điều này khác biệt so với mục tiêu của một phòng thí nghiệm mô hình cơ bản.
Để đạt được mục tiêu này, việc đào tạo mô hình thực sự có công việc phải làm, sản phẩm cũng có công việc phải làm. Nhưng đó mới thực sự là mục tiêu cốt lõi của chúng tôi.
Theo tôi, ADN của một công ty ở một mức độ nào đó khá cứng nhắc, cứ cứng nhắc hơn so với những gì mọi người thường tưởng. Sứ mệnh có thể thay đổi theo thời gian, nhưng phạm vi thay đổi không lớn như bạn tưởng. Đến một giai đoạn nào đó, mọi người trong công ty đều tập trung suy nghĩ về một điều: khách hàng mà bạn phục vụ, sản phẩm bạn xây dựng, mô hình kinh doanh bạn vận hành. Tất cả những điều này, đều có cội nguồn từ một mục tiêu cốt lõi cụ thể.
Vì vậy, đúng vậy, tôi nghĩ như bạn nói, cả hai bên đều sẽ tiếp tục di chuyển, tiếp tục mở rộng ra bên ngoài. Nhưng với các công ty như chúng tôi, ADN cốt lõi là mang lại lợi ích từ việc lập trình AI cho mọi người trên toàn thế giới. Điều này sẽ rất khác biệt so với một công ty thực sự tập trung vào đẩy mạnh nghiên cứu cơ bản.
Jeremy Stern: Liệu bạn có đi theo con đường của Cursor không?
Scott Wu: Chúng tôi thực sự thích làm "Thụy Sĩ". Điều này có một số lý do. Đầu tiên, chúng tôi nghĩ rằng đang xây dựng một cơ sở hạ tầng cần thiết, để các công ty có thể tin tưởng chúng tôi, coi chúng tôi như đối tác, cùng nhau tìm hiểu cách chạy nhanh hơn, giao hàng nhiều hơn. Vì vậy thẳng thắn mà nói, việc duy trì sự trung lập có giá trị lớn.
Bạn đã thấy điều này ở mối quan hệ của bạn với Databricks và các nhà cung cấp đám mây lớn. Nhưng ở đây, tôi nghĩ tình huống còn cực kỳ cấp thiết hơn. Bởi vì việc nhất quán niềm tin vào một mô hình cụ thể nào đó, sẽ là một điều đáng sợ. Không ai biết vào 12 tháng tới ai sẽ sở hữu mô hình tốt nhất.
Do đó, bằng cách làm việc với tất cả các mô hình khác nhau, sử dụng chúng khi mà mỗi mô hình phù hợp nhất với trường hợp sử dụng cụ thể, chúng tôi có thể nhanh chóng thích nghi với sự thay đổi, và cũng có thể giúp đối tác hiểu họ nên sử dụng các mô hình khác nhau như thế nào trong công việc của họ. Điều này rất quan trọng.
Ngoài ra, tôi cũng muốn chỉ ra rằng hiện nay trong ngành công nghệ đang tồn tại một cuộc tranh luận, ý chí là: tại sao cần phải sáng lập cái mới? Đúng là hiện nay liệu có cần thiết phải xây dựng mọi thứ từ đầu không?
Đằng sau đó dường như có một giả thiết: trên thế giới chỉ có thể tồn tại một số lượng hữu hạn công ty, vì các công ty hiện có cuối cùng sẽ thâu tóm tất cả mọi thứ. Ở Silicon Valley, có vẻ như đã quá mức tiềm năng về việc "còn có thể xây dựng một cái mới ý nghĩa từ đầu hay không". Tôi cho rằng điều này hoàn toàn sai lầm.
Vì vậy, chúng tôi cũng chỉ đơn thuần thích thách thức và tham vọng này: một nhóm người ngồi trong cùng một căn phòng, tự mình tạo ra một cái vĩ đại.
Điều này làm cho mọi thứ thêm thú vị.


Ảnh chụp: Andria Lo
Jeremy Stern: Trong thế giới AGI, thiên tài con người sẽ trông như thế nào?
Scott Wu: Theo tôi, đối với tất cả những người làm AI, một tài liệu tham khảo quan trọng nhất chính là sự tồn tại của bộ não con người.
Chúng ta không hiểu hết về bộ não con người, nhưng tôi cho rằng chúng ta đã hiểu đủ để nói rằng nó về cơ bản cũng là một loại mạch điện — nó về cơ bản là một máy tính được tạo từ thịt và máu. Tất nhiên, có rất nhiều chi tiết và nhiều vấn đề thú vị về việc nó được hình thành như thế nào. Nhưng trong lĩnh vực AI, chúng ta gọi những mạch điện này là "mạng thần kinh" chính vì chúng được lấy cảm hứng từ các neuron trong não.
Từ cách kết nối trong bộ não con người, chúng ta có thể thấy rằng nó có thể học và giải quyết những vấn đề cực kỳ khó khăn. Từ đó tự nhiên sẽ phát sinh một sự suy luận tiếp theo: miễn là có đủ thời gian, quy mô và năng lượng, chúng ta nên có thể tạo ra một "bộ não điện tử" hoạt động theo cách tương tự. Khác biệt duy nhất là chúng ta có thể tạo ra nhiều hơn những bộ não như vậy và có thể thêm nhiều mạch điện vào chúng.
Mọi người thường hỏi: có điều gì là con người mãi mãi có thể làm và AI mãi mãi không làm được không? Điều này thực sự khá thú vị, bởi trong những năm gần đây, nhiều câu trả lời mà mọi người đưa ra đã bị phản bằng chứng.
Tôi nhớ trước đây có người nói rằng máy tính có thể chơi cờ vua, nhưng không thể chơi cờ Gô. Vì cờ Gô cần một loại tri thức nền sâu șiêu nhanh cùng với sự hiểu biết sâu sắc về thế giới, và đây không phải là điều mà máy tính có thể nắm bắt. Rõ ràng, thực tế không phải như thế.
Giải quyết vấn đề toán học, tạo mã, hấp thụ thông tin mới và chứng minh các định lý mới, tất cả đều giống nhau. Trí tuệ nhân tạo đã vượt qua những bức tường này. Trong việc trả lời câu hỏi của bạn về vai trò của tâm trí con người, tôi không nghĩ rằng theo quan điểm từ quãng thời gian đủ dài, sẽ có bất kỳ khả năng nào mà trí tuệ nhân tạo mãi mãi không thể thực hiện được mà con người có thể.
Tuy nhiên, tôi tin rằng kinh nghiệm con người vẫn còn nhiều giá trị bên trong. Đồng sáng lập của tôi, Walden, từng nói: "Chúng ta luôn sống trong chế độ sinh tồn của 'Thế Giới của Tôi', và bây giờ, chúng ta sẽ bước vào chế độ sáng tạo." Tôi nghĩ đó là đúng.
Chúng ta đều có ham muốn, có những thứ muốn xây dựng, có cách thể hiện bản thân, cũng như cách tìm kiếm niềm vui và ý nghĩa. Chúng ta vẫn muốn làm những điều đó. Và bây giờ, chúng ta sẽ có trí tuệ nhân tạo, cùng nhau giải quyết những vấn đề cực kỳ khó khăn và quan trọng đó.
Jeremy Stern: Nhưng thực tế, con người không phải là một máy tính cơ bản. Chúng ta có cái gọi là phẩm giá. Trong truyền thống chung mà chúng ta thuộc về, phẩm giá được phân phối công bằng cho mọi người, không phụ thuộc vào khả năng của họ, do đó không thể bị loại trừ thông qua cạnh tranh.
Chúng ta sinh ra vào một thời điểm nhất định, một địa điểm nhất định, có cha mẹ nhất định, và được đặt tên. Chúng ta có nguồn gốc từ một nơi nào đó. Chúng ta phần lớn bị định hình bởi những kí ức, những kí ức mà chúng ta không lựa chọn. Chúng đã định hình những khái niệm cốt lõi nhất khi chúng ta nhận thức ý thức, như khái niệm "gia đình".
Nếu mọi thứ này chỉ là mạch điện có thể sao chép, liệu "giá trị bên trong" có phải chỉ là một loại hóa dược không? Hoặc nói cách khác, là cách thức trốn tránh?
Scott Wu: Phần đoạn vừa nói của chúng ta, tiệm cận hơn với kết thúc trong tương lai dài hạn của trí tuệ nhân tạo. Nhưng trong tương lai ngắn và trung hạn, AGI không phải là một khái niệm thật sự nhị phân — nó giống như một quá trình từng bước tiến lên.
Trong thời gian tới, sẽ liên tục có sự tiến triển dần dần: tốt, nó đã có thể làm những điều này, nhưng vẫn chưa thể làm việc kia. Sau đó, chúng ta sẽ giải quyết cả việc đó.
Chính vì vậy, tôi nghĩ rằng nhiều nhiệm vụ đặc tả cao, nhiệm vụ phổ quát — bạn phải hiểu về rất nhiều sự kiện diễn ra trên thế giới, hấp thụ một lượng thông tin lớn và đưa ra những kết luận trực quan chính xác — trong tương lai trung hạn, con người vẫn giữ ưu thế.
Theo thời gian, nếu trí tuệ nhân tạo có cùng ngữ cảnh với con người và làm việc với mục tiêu tương tự, cuối cùng nó cũng nên có thể làm được.
Hiện tại, tôi nghĩ tôi, hoặc bất kỳ con người nào, một trong những ưu thế lớn nhất là chúng ta đều có thể tiếp cận với ngữ cảnh mềm mại cực kỳ phong phú.
Nếu tôi nghĩ về công việc chúng ta làm mỗi ngày tại Cognition, hoặc bất kỳ công ty nào khác, thì có quá nhiều điều không phải luôn phải giải quyết một vấn đề logic cơ bản từ đầu. Ở mức độ logic thuần túy, trên hầu hết mọi mặt, trí tuệ nhân tạo (AI) đã cơ bản bằng với bất kỳ con người nào.
Nhưng ở một khía cạnh khác, nếu tôi nghĩ về tất cả những quyết định nhỏ mỗi ngày chúng ta đưa ra, hoặc nguyên tắc chúng ta chọn làm việc theo một cách nào đó, hoặc một phần cụ thể của lịch sử—ví dụ, "Đó là lý do vì sao chúng ta ban đầu thiết kế kiến trúc hệ thống như vậy, nhưng sau khi một công nghệ mới xuất hiện, chúng ta quyết định chuyển dần sang một framework khác"; hoặc "Đây là cách làm đặc biệt của Cognition, khác biệt so với hầu hết các công ty khác"—tất cả những điều này, khả năng xử lý bối cảnh, truy xuất thông tin, triệu hồi kinh nghiệm của con người, đều rất mạnh mẽ.
Tôi hơi thích nói rằng, việc truy xuất là một trong những điều mà con người thực sự giỏi. Thực ra, điều này cũng chính xác với lời bạn vừa nói về trí nhớ.
Nếu so sánh với mô hình và não bộ con người, mô hình có một cửa sổ ngữ cảnh, có các token mà nó có thể nhìn thấy và đọc, có các công cụ mà nó có thể triệu hồi, và một trong những công cụ có lẽ chính là truy xuất. Cửa sổ ngữ cảnh của chúng ta thấp hơn nhiều. Về điều này, một trò đùa mà tôi thường nói là mã xác thực 2 yếu tố gồm sáu chữ số. Nếu mã xác thực trở thành mười chữ số, tôi không biết chúng ta liệu còn có thể xử lý được hay không. Đó chính là cửa sổ ngữ cảnh ngắn của chúng ta.
Nhưng ở một khía cạnh khác, như một con người, bạn có một khả năng rất tuyệt vời: bạn mở một tệp mã, đột nhiên, một ký ức nào đó đánh vào bạn—ơ, đúng, bốn tháng trước khi tôi giải quyết vấn đề này, chúng ta đã gặp phải lỗi này, vào lúc đó là như thế này. Và đó chính là thông tin bạn cần biết để hoàn thành nhiệm vụ hiện tại.
Jeremy Stern: Bánh mỳ bánh mì của lập trình viên được ngâm vào trà.
Scott Wu: Hoặc bạn đang nói chuyện với ai đó, đột nhiên nhớ ra: Ồ, phải, bảy tháng trước, bạn có nói về vấn đề này phải không?
Điều này không giống với ngữ cảnh ban đầu. Nó giống hơn với việc tích luỹ và hiểu tất cả ngữ cảnh mềm mị của chúng ta trải qua. Theo tôi, đây chính là ưu điểm chính của con người so với AI hiện tại.
Hiện nay, có một số loại vấn đề trong lĩnh vực trí tuệ nhân tạo đang được nghiên cứu xung quanh vấn đề này. Một trong số đó là nhúng tìm kiếm. Một khía cạnh nào đó, nó là điều tương ứng trực tiếp nhất: trong một cơ sở dữ liệu lớn chứa tất cả các cuộc trò chuyện trước đây, các tệp mã khác nhau, hoặc bất kỳ dữ liệu nào bạn có thể muốn tìm kiếm, làm thế nào để truy xuất chính xác phần nào liên quan nhất đến vấn đề hiện tại?
Còn một loại vấn đề khác đang được đẩy mạnh, hầu hết các chuyên gia trong ngành đều gọi là học liên tục. Ý nghĩa của nó là—tôi nghĩ rằng điều này gần nhất với cách hoạt động của tâm trí con người—AI làm thế nào để cập nhật trọng số của chính nó dựa trên những gì nó đã học được?
Đây là một ý tưởng tổng quan, cụ thể là "những tế bào thần kinh được kích hoạt đồng thời sẽ kết nối với nhau". Bạn hy vọng rằng trí tuệ nhân tạo (AI) sau khi tham gia cuộc trò chuyện và trải qua những trải nghiệm này, sẽ có khả năng cập nhật trọng số của chính mình. Lí thuyết cho rằng điều này sẽ giúp nó ghi nhớ được khi gặp vấn đề tương tự trong lần tiếp theo. Đây đều là những chủ đề đang được tích cực khám phá hiện nay. Tôi nghĩ sẽ có một thời điểm, có lẽ không quá lâu, mà AI sẽ có thể làm điều này. Nhưng ít nhất ở thời điểm hiện tại, con người vẫn chiếm ưu thế ở đây.
Một cách nào đó, việc giải quyết vấn đề của AI, thực sự có nghĩa là giải quyết bản chất của tri thức.
Điều này là một điều rất điên rồ, nhưng cũng là một điều phải đối mặt một cách nghiêm túc. Bởi vì trong lịch sử nhân loại, chúng ta luôn sống trong giả định rằng: chúng ta có thể làm cho công cụ này hoặc công cụ kia trở nên nhanh hơn, nhưng cuối cùng, vẫn cần một con người tham gia trực tiếp để giải quyết vấn đề, để biết phải làm gì. Vẫn phải có một con người tạo ra thứ đó.
Cho đến nay, chúng ta luôn coi việc "có khả năng suy nghĩ và giải quyết vấn đề mới" là phần cốt lõi của bản người. Sự thay đổi này, không có nghĩa là nó chắc chắn là điều xấu. Tôi nghĩ rằng có một AI có khả năng hỗ trợ chúng ta trong lĩnh vực này sẽ là một điều rất tốt.
Để nói một cách thơ mộng hơn, AI là một cần câu, nó sẽ đảm bảo rằng những ước mơ của chúng ta không cần phải mãi mãi dừng lại ở giấc mơ. Nhưng thực sự như bạn nói, đúng là đã đến lúc cần phải suy nghĩ lại, định vị lại "lý do chúng ta trở thành con người".
Jeremy Stern: Vậy, chúng ta trở thành con người vì điều gì?
Scott Wu: Tôi sẽ đưa ra một ví dụ mô phỏng như sau.
Hãy tưởng tượng một chút cách đây vài trăm năm, vài nghìn năm trước tổ tiên của chúng ta, họ sẽ nhìn chúng ta như thế nào? Họ thấy chúng ta nhấn nút trên máy tính, sau đó đi vào một căn phòng khác, chỉ đơn giản nói chuyện ở đó. Chúng ta gọi điều này là cuộc họp, gọi là công việc. Trong khi đó, họ phải làm việc trên cánh đồng mỗi ngày trong tuần, đảm bảo có đủ thức ăn.
Hãy đi từ sự thay đổi đó đến ngày hôm nay, nguyên tắc cơ bản là chúng ta đã học cách tự động hóa nhu cầu về sức lao động vật lý. Nghĩa là, con người đã có thể thực hiện công việc chủ yếu dựa trên kiến thức và tư duy. Nếu phải tóm tắt những gì con người đã làm trong 200 năm qua thành một câu, đó chính là điều đó.
Và bây giờ, chúng ta đang tiến gần hơn đến việc giải quyết vấn đề của "sức lao động nguyên thủy".
Điều này sẽ mang lại điều gì? Một số ví dụ dễ dàng hơn là: Bạn muốn một chiếc bánh pizza dinh dưỡng hoàn hảo, ngon ngon mà lại không nặng bụng sao? Bạn muốn một chiếc Ferrari không? Bạn muốn slam dunk không? Được, bây giờ bạn có thể thực hiện được.
Nói một cách nghiêm túc hơn, tôi nghĩ rằng, chuyển từ chế độ tồn tại sang chế độ sáng tạo, là hướng đi đúng đắn. Điều này sẽ không xảy ra trong hai hoặc bốn năm tới, nhưng nó đang đến gần.
Vào một thời điểm nào đó, hạn chế duy nhất mà bạn thực sự phải đối mặt sẽ chỉ là những điều bạn có thể tưởng tượng và cách bạn muốn sống cuộc đời của mình. Đó sẽ là một cuộc sống rất khác biệt.
Trong việc trả lời câu hỏi của bạn, tôi nghĩ một phần lớn sẽ là sự tự thể hiện tinh thần. Mọi người sẽ có cơ hội sống cuộc sống mà họ mơ ước. Rào cản chuyển đổi giấc mơ thành hiện thực sẽ bị co lại đáng kể.
Và cách chúng ta sống hiện nay, vào thời điểm đó sẽ trông rất điên rồ.
Jeremy Stern: Anh sợ điều gì nhất?
Scott Wu: Lần đầu tiên khi nghe câu hỏi này, điều mà ngay lập tức nảy trong tâm trí là những cuộc cách mạng công nghệ trong quá khứ.
Ở Silicon Valley, mọi người thường nghĩ đến điện thoại di động, internet, đám mây, máy tính cá nhân. Nhưng bạn cũng có thể tiếp tục về phía trước, đến với điện, thậm chí là cách mạng công nghiệp. Mặc dù tôi nghĩ rằng quy mô của Trí tuệ Nhân tạo lớn hơn, hình thức của nó cũng có thể khác biệt so với những công nghệ đó, nhưng ở mức cao hơn, chúng thực sự khá tương đồng.
Trong tầm nhìn dài hạn, Trí tuệ Nhân tạo là một sức mạnh phi thường. Nó sẽ thay đổi cuộc sống của tất cả chúng ta, cho phép chúng ta làm nhiều điều hơn. Tôi nghĩ rằng chúng ta đều đồng ý, có thể sống như ngày hôm nay, thay vì đẩy 90% lao động của con người vào nông nghiệp, đó là một đổi mới tuyệt vời.
Nhưng mặt khác, trong tầm ngắn hạn và trung hạn, tôi nghĩ thực sự sẽ có sự cọ xát thực sự. Có thể nói rằng, điều mà tôi lo lắng không phải là Trí tuệ Nhân tạo mà là sự cọ xát mà tất cả sự phát triển quá nhanh đã mang lại.
Điều này đến một mức lớn là một vấn đề: chúng ta phải coi trọng việc giáo dục cho toàn bộ cộng đồng trên thế giới. Mọi người sẽ sử dụng công nghệ này như thế nào? Nó làm thế nào để cải thiện cuộc sống của họ? Và làm thế nào để nhiều người hơn có thể truy cập vào nó một cách đồng đều?
Tôi nghĩ, kết quả tồi tệ nhất là, trong một khoảng thời gian đáng kể, chỉ có những người elita ở San Francisco hoặc các nhóm nhỏ tương tự mới thực sự có thể sử dụng những khả năng này, trong khi những người khác bị loại trừ.
Hoặc có thể lấy một ví dụ cụ thể mà chúng ta đã trải qua trong vài tuần qua: Nếu mô hình đã có khả năng tấn công mạng mạnh mẽ, nhưng rất nhiều người trên thế giới không sử dụng khả năng tương tự để phòng thủ, trong khi những hacker thông minh đã sử dụng chúng để tấn công, thì thế giới sẽ rơi vào một trạng thái mất cân bằng rất khó khăn.
Vì vậy, điều thực sự quan trọng là, toàn bộ thế giới phải hiểu công nghệ này, có thể sử dụng nó và có thể hợp tác với nó. Một phần lớn vấn đề thực sự nằm ở việc, chúng ta có thể chuẩn bị con người cho nó với tốc độ nhanh như thế nào.
Cách mà Cách mạng công nghiệp xảy ra trong vài thế hệ. Đó là một quá trình chuyển đổi rất từ từ, mọi người sẽ dần dần học hỏi theo thời gian và những thay đổi sẽ từng chút một tiếp cận cuộc sống của họ. Nhưng những thay đổi chúng ta thấy ngày nay, tốc độ nhanh hơn nhiều.
Tôi tin rằng con người có thể thích nghi, chúng ta cũng sẽ tìm ra nhiều cách để công nghệ mới cải thiện cuộc sống của chúng ta — cho dù đó là việc phát hiện thuốc, làm một chiếc bánh pizza vừa ngon miệng vừa dinh dưỡng hoàn hảo, hoặc cải tiến tất cả các công nghệ chúng ta sử dụng hàng ngày.
Nhưng điều này cũng có nghĩa là, con người phải bắt kịp những điều đang diễn ra. Trong nhiều cuộc cách mạng công nghệ trước đây, nếu bạn chậm trễ hai hoặc năm năm trong việc áp dụng, bạn vẫn còn kịp. Nhưng lần này, việc thích nghi phải diễn ra nhanh hơn.
Jeremy Stern: Khi bạn không phải là người thực sự tham gia vào phát triển trí tuệ nhân tạo, việc hình dung những điều đó thật sự khó khăn. Đó cũng là lý do tại sao chúng ta những người ngoại vi, thường cảm thấy nhiều người quan trọng trong lĩnh vực trí tuệ nhân tạo nói dối, ít nhất là khi họ nói về tương lai.
Scott Wu: Một điều tôi thường nghĩ đến là nghiên cứu về METR.
Nghiên cứu đó cho thấy, hiện nay các hệ thống thông minh có thể hoàn thành công việc tương đương với hàng giờ của con người trước khi cần phải bị ngắt kết nối, và thời gian này đang tăng gấp đôi mỗi vài tháng. Đó là cách mà trong vài năm qua, các hệ thống thông minh đã phát triển từ việc chỉ có thể làm việc vài giây, đến việc có thể liên tục làm việc hàng giờ.
Vấn đề rõ ràng là: Nếu sự tăng gấp đôi này tiếp tục, điều gì sẽ xảy ra? Chúng ta không còn nói về vài giờ nữa, mà là vài ngày, và cuối cùng có thể là cả một năm.
Thú vị nhất là, chúng ta đã đi theo đường cong đó, đã thấy nó vượt từ vài giây lên vài phút, sau đó lên vài giờ. Nhưng mặc dù vậy, điều đó vẫn khiến chúng ta cảm thấy lạ lẫm. Khi nói về những thứ mà tâm trí con người không giỏi, chúng ta thực sự rất kém trong việc hiểu biểu đồ mũi tên số mũ.
Một hệ thống thông minh có thể hoàn thành công việc trong một năm có nghĩa là gì? Bạn giao cho nó một nhiệm vụ, nó nói: "Để tôi xử lý." và sau một năm, nó trở lại và mọi thứ đã hoàn thành. Điều này nghe có vẻ điên rồ, nhưng tôi tin rằng, chúng ta thực sự sẽ đạt được điều đó.
Tôi nghĩ rằng nhiều người ngoài vòng AI luôn có cảm giác: Ok, đường cong bất ngờ bắt đầu dốc lên, nhưng đây chắc chắn là điểm dừng và bước vào giai đoạn ổn định. Sau đó nó tiếp tục tăng lên, họ sẽ nói, Ok, nhưng lần này chắc chắn là trần của nó rồi.
Với những người đang hoạt động trong lĩnh vực trí tuệ nhân tạo, đã thấy với mắt mình mọi thứ này, cảm giác khác biệt không chỉ là vì bạn đã nhìn thấy từng điểm dữ liệu nhỏ trên đường cong. Bạn biết nó đã đi được đến đâu. Trong ba năm qua, không phải đã xảy ra 14 lần đột phá, có thể chỉ có một lần. Nhưng chúng ta có thể thấy, nếu tiếp tục đi theo con đường đó, đẩy khả năng tiến lên, chúng ta có thể làm được điều gì.
Ngay cả đối với tất cả mọi người sâu trong lĩnh vực trí tuệ nhân tạo, điều đó vẫn là điều khó hiểu thực sự.
Jeremy Stern: Bạn có thể tự động hóa bao nhiêu công việc hàng ngày để tôi có thể quay trở lại sở thích ưa thích nhất của mình?
Scott Wu: (cười) Đơn giản là: Một người mỗi ngày có bao nhiêu ý tưởng? Và trong số những ý tưởng đó, có bao nhiêu thực sự có thể thực hiện được?
Chỉ cần tỉ lệ này chưa đạt đến 100%, bạn sẽ biết rằng, ở mức độ thực thi, vẫn có một rào cản khá rõ rệt. Tôi không nghĩ rằng tỉ lệ này đã đạt gần đến 100% - có thể chỉ là 5%. Bạn sẽ có nhiều ý tưởng về việc làm, việc xây dựng, việc thử nghiệm, nhưng trong thực tế, việc điều chỉnh chúng thực sự khó khăn hơn nhiều.
Tôi nghĩ rằng đây là một trong những khả năng lớn mà AI sẽ mở khóa. Bạn đặc biệt có thể thấy điều này trong lĩnh vực phần mềm.
Tôi chưa bao giờ thấy một nhóm kỹ sư nào coi công việc của mình như thế này: Được rồi, chúng ta sẽ phát hành dự án này trong tháng này, sau đó hoàn tất tất cả vào tháng sau, không cần phần mềm nữa, chúng ta đã tạo ra tất cả những điều mà chúng ta muốn tạo ra rồi.
Thực tế luôn ngược lại: Bạn có 85 dự án, nhưng chỉ có thể chọn 6, vì băng thông của bạn chỉ đủ cho đến thế. Trong tương lai, chúng ta sẽ thấy, nhiều người sẽ có thể làm tất cả những điều mà họ muốn làm.
Khi mọi người nói rằng họ yêu thích việc xây dựng phần mềm, họ thực sự yêu thích điều gì? Trong thực tế, có 10% công việc đó là sự tự biểu hiện thực sự: Bạn có thể suy nghĩ về việc đối mặt với từng vấn đề, làm thế nào để chọn lựa, sử dụng mô hình nào, xây dựng sản phẩm cụ thể ra sao.
Và 90% còn lại, là viết mã, sửa lỗi, thực thi và nhiều lao động lặp đi lặp lại. Khi mọi người nói rằng họ thực sự yêu thích việc xây dựng phần mềm, thường thì họ bị thu hút bởi phần trước.
Mọi lĩnh vực đều vậy. Chúng ta sẽ đến một giai đoạn: Bạn có thể làm 10 lần nhiều hơn phần 10% mà bạn thực sự yêu thích.
Jeremy Stern: Câu hỏi cuối cùng. Tôi luôn quan tâm đến những người nào được phù hộ bởi một cách nào đó bởi Thượng đế, hoặc được Thượng đế đặc ân.
Họ có một số tài năng. Họ có thể cũng rất cố gắng, sinh ra trong gia đình tốt, được giáo dục tốt, gặp gỡ bạn bè và người hướng dẫn xuất sắc, cũng đủ may mắn, sinh ra vào thời đại phù hợp, hoặc làm theo những gì Malcolm Gladwell bảo họ phải làm, để đạt được thành tựu ngày hôm nay.
Nhưng cuối cùng, ở đó có một món quà. Đó là lưỡi gươm trong cuộc sống của họ.
Nó có thể được sử dụng vì điều thiện, nhưng cũng có thể bị lãng phí, lạm dụng. Nó có thể bị phung phí, hoặc có thể bị lợi dụng. Nó có thể làm được những điều mà bạn nói AI sẽ làm - biến mọi giấc mơ thành hiện thực. Nó cũng có thể bị tiêu tan dần dần, thậm chí đảo lộn và phá hoại bạn.
Vì vậy, tôi muốn biết: Với tư cách là một người được ban tặng, một cái gì đó gồm cả một bộ óc toán học 16 xilanh, thêm vào đó chút tính không sợ khó và đấu tranh, bạn nghĩ bạn đang chọn sử dụng tài năng đó để làm gì? Và bạn cảm thấy mình đã chọn đúng không?
Scott Wu: Đơn giản là...
Trí tuệ nhân tạo có thể là sự kiện quan trọng nhất trong lịch sử nhân loại và lập trình là cách nó học cách hành động và xây dựng trong thế giới thực. Nếu tôi định sẵn phải làm một điều gì đó, nếu tôi đến đây với một lý do, tôi nghĩ rằng đó là để trở thành người dạy trí tuệ nhân tạo lập trình.
Tôi có thể thất bại. Nếu sự thật chứng minh rằng, tôi không phải là người định sẵn đảm nhận vai trò đó, tôi chắc chắn sẽ rất buồn. Vì tôi cực kỳ không chịu thua cuộc và rất tham vọng.
Nhưng điều thực sự khiến tôi không thể đối mặt với bản thân, là một kết quả khác: tôi có điều gì đó hoàn hảo phù hợp với một điều mà tôi luôn yêu thích, quan tâm và may mắn có chút tài năng, nhưng lại không dốt lòng cho nó hết mình.
Nếu cuối cùng vấn đề là, tôi không đủ cố gắng, hoặc không đủ động lực để làm điều đó, trong trường hợp đó, tôi nghĩ rằng tôi sẽ không còn thể đối mặt với chính mình nữa.
Jeremy Stern: Cảm ơn bạn, Scott.
Scott Wu: Ừ. Đến đây, chúng ta nên thử những quả dâu này.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia