BTC
$96,000
5.73%
ETH
$3,521.91
3.97%
HTX
$0.{5}2273
5.23%
SOL
$198.17
3.05%
BNB
$710
3.05%
lang
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
Trang chủ
Cộng đồng
AI AI
Tin nhanh
Bài viết
Sự kiện
Thêm
Thông tin tài chính
Chuyên đề
Hệ sinh thái chuỗi khối
Mục nhập
Podcast
Data
OPRR

Ghi Chú Khởi Nghiệp 8 Năm của Cộng Sự Điều Hành AI tại a16z

Đọc bài viết này mất 20 phút
Bước đầu tiên của Trí tuệ Nhân tạo Sinh học đang vào giai đoạn cuối, ngành công nghiệp đang chuyển dịch sang sản phẩm hóa và cạnh tranh quy mô
Tiêu đề bản gốc: Ghi Chú từ 8 Năm làm Người Sáng Lập trong AI Tạo Hình
Tác giả bản gốc: @lishali88
Dịch: Peggy, BlockBeats


Chú thích biên tập: Bài viết này đến từ một người sáng lập sớm trong lĩnh vực AI Tạo hình, trong bối cảnh 8 năm. Vào năm 2018, khi GPT chưa xuất hiện, anh ấy đã thành lập Rosebud AI với mục tiêu "Làm cho sáng tạo trở nên dễ dàng như chơi game" và liên tục phát hành nhiều công cụ sáng tạo AI bao gồm cả TokkingHeads. Trong giai đoạn mà khả năng của mô hình chưa hoàn thiện, những sản phẩm này thông qua quy trình thiết kế và tương tác, đã tăng cường trải nghiệm "tạm chấp nhận nhưng dễ sử dụng," từ đó hoàn thành quá trình tăng trưởng người dùng ban đầu và xác minh sản phẩm.


Kinh nghiệm này, gần như bao phủ toàn bộ chu kỳ tiến hóa của AI Tạo hình từ "đa phương tiện tổng hợp" đến cơ sở hạ tầng khả năng chung: từ sự thăm dò thử nghiệm của CycleGAN, StyleGAN cho đến việc GPT-4 mở ra ranh giới của mã nguồn tạo hình và sáng tạo tương tác, sự tiến bộ về công nghệ đã liên tục viết lại logic sản phẩm và nhịp điệu khởi nghiệp. Con đường của tác giả cũng phản ánh một sự thay đổi cấu trúc rõ ràng hơn – khi mô hình trở thành biến số, sự phân chia rõ ràng không chỉ là về công nghệ chính nó mà còn về cách xây dựng sản phẩm xung quanh nó, phân phối và thương mại hóa.


Sau khi từ chức CEO và tham gia vào a16z, tác giả sẽ chuyển hướng đầu tư vào ngăn xếp mô hình tiên tiến và cơ sở hạ tầng liên quan. Nhưng quan trọng hơn con đường cá nhân là, kinh nghiệm 8 năm này chỉ ra một xu hướng đang hình thành: giai đoạn đầu tiên của AI Tạo hình (chứng minh được khả năng) đang kết thúc, tiếp theo là một cuộc cạnh tranh kéo dài hơn, xoay quanh việc khả năng được tổ chức như thế nào, được sản phẩm hóa, và cuối cùng là nhập vào thế giới thực.


Dưới đây là nội dung bản gốc:


Tôi đã gia nhập a16z, đảm nhận vị trí đối tác, tập trung vào đầu tư cơ sở hạ tầng và AI. Đồng thời, sau 8 năm điều hành Rosebud AI, tôi cũng sẽ từ chức CEO.


Dưới đây là một số điểm tổng kết và suy ngẫm của tôi về 8 năm này. Đối với những người vẫn đang xây dựng trên tuyến đầu hiện tại, tôi có lòng tôn trọng rất lớn. Một lần phát hành mô hình có thể làm thay đổi toàn bộ lộ trình sản phẩm của bạn, hoặc có thể đẩy nó về phía trước một số năm. Thiết kế, sản phẩm, kỹ thuật – những hình thức chức năng này đã thay đổi so với 3 tháng trước, chứ chưa kể đến so với 8 năm trước. Tốc độ tiến bộ công nghệ đã biến thời kỳ này trở thành thời điểm khởi nghiệp nổi tiếng nhất nhưng cũng là khó khăn nhất.


Tại a16z, tôi sẽ tập trung vào ngăn xếp mô hình tiên tiến: bao gồm cả mô hình chính nó và cơ sở hạ tầng và công cụ phát triển xây dựng xung quanh mô hình. Tôi cảm thấy hào hứng với sự tiến triển nhanh chóng của khả năng mô hình – ngày càng nhiều tiến bộ được thúc đẩy bởi chính AI. Đồng thời, tôi cũng nhìn nhận tiềm năng mà AI mang lại trong lĩnh vực toán học và khoa học. Ngoài ra, vì đã bỏ công sức xây dựng các công cụ sáng tạo AI trong suốt 8 năm qua, tôi luôn quan tâm đặc biệt đến hướng này.


Trước đó, tôi cũng đã tham gia đầu tư tiền thiên thần vào một số vòng đầu, bao gồm @fal, @periodiclabs, @SakanaAILabs và @ExaAILabs. Tiếp theo, tôi rất mong muốn có thể tập trung toàn bộ năng lượng vào việc hỗ trợ những người sáng lập đang xây dựng ngăn xếp công nghệ này.


2018: Trước khi GPT xuất hiện, đặt cược vào AI sinh sản.



Vào tháng 11 năm 2018, tôi sử dụng CycleGAN xử lý hình ảnh trò chơi “Myst”, thử nghiệm video thí nghiệm chuyển đổi các khu rừng thành rừng nhiệt đới.

Để khởi nghiệp trong lĩnh vực AI sinh sản, 8 năm là một khoảng thời gian khá dài.


Tôi bắt đầu từ cuối năm 2018, điều đó hầu như là một "thời đại cổ xưa", lúc đó lĩnh vực này vẫn được gọi là "truyền thông tổng hợp (synthetic media)". Tôi đã thử nghiệm với CycleGAN và StyleGAN, nội dung chúng tạo ra vừa kỳ lạ vừa hấp dẫn, khiến tôi tin rằng: một ngày nào đó, sáng tạo sẽ trở nên mượt mà như việc xây dựng trong trò chơi (tên "rosebud" cũng đến từ The Sims cuộc sống mô phỏng).


Sáng tạo trong trạng thái lý tưởng nhất nên là một trò chơi. Và ánh sáng ban đầu của AI sinh sản đã khiến tôi tin rằng, trải nghiệm sáng tạo "như chơi" này có thể mở rộng đến nhiều hình thức sáng tạo khác. Tôi bắt đầu mơ mộng về cách mà AI sinh sản sẽ làm thay đổi trò chơi điện tử (ví dụ như video CycleGAN mà tôi đã huấn luyện dựa trên hình ảnh "Myst" vào năm 2018).


8 năm trôi qua nhanh chóng, bây giờ chúng ta có thể tạo ra video, trò chơi hoặc thậm chí âm nhạc chỉ từ một từ gợi ý. Tương lai mà trước đây chúng ta chỉ mơ thấy, cuối cùng đã đến — và đó chỉ là khởi đầu.


Nhìn lại, lý do tại sao tôi có thể hình thành một niềm tin mạnh mẽ ở giai đoạn rất sớm, có lẽ là vì cuộc sống của tôi luôn ở điểm giao của công nghệ và nghệ thuật: một bên là nền tảng toán học và học sâu, một bên là đam mê nghệ thuật như khiêu vũ và âm nhạc. Khởi nghiệp AI sinh sản đúng là cần sự kết hợp của cả hai: nền tảng kỹ thuật giúp tôi nhìn thấy điều đang đến, xu hướng nghệ thuật giúp tôi không thể chờ đợi để xây dựng nó.


Hành trình khởi nghiệp luôn dai dẳng hơn và khó khăn hơn so với những gì ta tưởng. Chỉ khi bạn tìm thấy điều mà bạn tin đến gần như mù quáng, bạn mới có thể tối đa hóa khả năng kiên trì.



Vào năm 2017 với CycleGAN, chúng ta đã đi xa

2018—2023: Làm hài lòng người dùng bằng "đủ dùng là đẹp".



Ảnh chụp màn hình giao diện của Ứng dụng iOS Tokkingheads phiên bản thứ ba. Nhân tố cốt lõi của AI sinh học sớm là thiết kế một quy trình sáng sủa và chấp nhận tính thô cơ bản của sản phẩm một cách tích cực


Trên con đường này, chúng tôi đã phát hành nhiều sản phẩm nhằm mài giũa sự hiểu biết về khả năng của mô hình tiên tiến và học cách đóng gói nó thành một trải nghiệm thần kỳ có thể che giấu nhược điểm sớm. Tại giai đoạn đó, tôi nhận ra: khi đầu ra của mô hình chưa hoàn hảo, bạn có thể thiết kế một trải nghiệm tiêu dùng cho phép người dùng lặp lại nhanh chóng và phản hồi một cách nhanh chóng. Người dùng khó tính, nhưng không mong manh - tạo ra điều mong muốn và dễ sử dụng là đủ để họ phải lòng.


Khi đến với ứng dụng di động thứ ba, chúng tôi đã tích luỹ đủ nhận thức để Tokkingheads thực sự phát triển tự nhiên theo hình thức lan truyền dữ dội, với hơn 2 triệu người dùng trong vài tuần. Sau đó, một bài học chính đến với tôi: với tư cách là người sáng lập, bạn phải rõ ràng về dạng sản phẩm nào có thể giữ cho bản thân mình luôn hứng thú trong dài hạn. Tokkingheads có thể đi theo đường dẫn trở thành một sản phẩm nổi tiếng nhưng tôi không chắc chắn rằng đó là nơi phát triển phép màu sáng tạo này thành một sản phẩm toàn diện, và chính sản phẩm toàn diện đó mới là điều tôi thật sự mong muốn.


Và sau đó chúng tôi tiếp tục cải tiến. Chúng tôi đã thử nghiệm với thư viện hình ảnh do AI tạo ra, nghệ thuật AI đi kèm với NFT (đúng rồi... tôi đã ngây thơ tin rằng chất lượng tác phẩm mới là chìa khóa, nhưng cuối cùng nhận ra rằng kỹ năng thực sự quan trọng là bánh vẹo và đầu cơ), cũng như công cụ tạo nguyên liệu trò chơi bằng AI. Mỗi sản phẩm đã dạy tôi một số điều cụ thể: người dùng sẵn lòng trả tiền cho điều gì, và mô hình đang phát triển với tốc độ nhanh chóng. Xen giữa những dự án đó là một đại dịch toàn cầu, cũng như cuộc khủng hoảng giao hàng giữa Ngân hàng Silicon Valley và Ngân hàng Cộng hòa đầu tiên - những thứ này nhắc nhở tôi học cách biết ơn. Có thể tiếp tục xây dựng là một đặc quyền.


Năm 2023: Sự Trưởng Thành của Mã Nguồn


Mã nguồn cuối cùng đã trở nên đủ tốt để, vào thời điểm phù hợp, bạn có thể tạo ra công cụ trò chơi cho những người sáng tạo không chuyên về công nghệ. Sau khi GPT-4 được phát hành, tương lai trở nên cụ thể hơn. Vào tháng 3 năm 2023, tôi đã chia sẻ một bản ghi chú với nhóm và dùng bản cắt dưới đây kết hợp với mô hình phát triển ban đầu của chức năng chuyển văn bản thành trò chơi Rosebud.



Ảnh chụp màn hình tweet vào ngày 23 tháng 3 năm 2023. Tôi đã học Three.js qua GPT-4, kết hợp với AI sinh học Rosebud để tạo ra hộp trời, mô phỏng một nguyên mẫu sớm về cách triệu hồi cảnh 3D thông qua văn bản



Đầu năm 2023, bức ghi chú nội bộ của tác giả gửi đến nhóm, ghi lại sự đánh giá sản phẩm sau bước tiến trong khả năng tạo mã nguồn. Điểm chính của bức thư này là: AI đang trong giai đoạn quyết định tác động đến những thập kỷ tiếp theo, và hai năm tiếp theo sẽ là giai đoạn cạnh tranh cấp cao, với tốc độ nhanh chóng, cường độ cao và rõ ràng về việc loại bỏ. Công ty sẽ tập trung toàn lực vào cuộc "sprint" này, chỉ dành cho những người có động lực bên trong mạnh mẽ, sẵn sàng chịu áp lực và cam kết dài hạn - vì đây không chỉ là một trải nghiệm làm việc, mà còn là cơ hội lịch sử có khả năng thay đổi hướng nghiệp vụ cá nhân.


Năm 2026 và Sau Này: Bạn Có Thể Xây Dựng Những Thứ Mà Laboratorio Không Muốn?



Hình ảnh: Video Demo - Tác giả xây dựng trò chơi mô phỏng thành phố 3D trên trình duyệt bằng từ khóa


Để tạo ra trò chơi, bạn cần kích hoạt cả trực giác sáng tạo và khả năng kỹ thuật. Trí tuệ nhân tạo sinh học là yếu tố quan trọng để biến việc tạo trò chơi trở thành một trò chơi tự nhiên - bất kỳ tiến bộ nào trong mô hình hình ảnh, video, thế giới hoặc mã nguồn đều sẽ được hấp thụ và chuyển hóa ngay lập tức. Mô hình kinh doanh của trò chơi cũng có thể đang ở nơi mà Laboratorio không để ý: con đường cốt lõi để kiếm tiền vẫn là người chơi trả phí, và việc xây dựng hệ thống phân phối từ phía người chơi, đối với Laboratorio đang tập trung cực kỳ nhanh vào AGI, dường như là một nhiệm vụ phụ quá mức. Với những người sáng lập, việc chọn xây dựng cái gì luôn là một trò chơi kiếm chỗ tìm kiếm không gian ở ngoài lộ trình quan trọng của laboratorio.


Tình hình phất lên của Rosebud đang mạnh mẽ. Chúng tôi đã tự nhiên tích lũy một cộng đồng tạo trò chơi lớn và tích cực. Tôi sẽ nhớ những buổi trò chuyện với tác giả trên Discord và những ngày xử lý email hỗ trợ người dùng mỗi ngày (người dùng nào sẵn lòng phàn nàn, chắc chắn rất quan tâm đến sản phẩm của bạn). Trọng tâm của giai đoạn tiếp theo là mở rộng quy mô phân phối từ phía người chơi, vì vậy bây giờ là thời điểm tốt để nhường gậy đường đua cho đồng đội luôn cùng chiến đấu.


Chúc mừng @glazworks trở thành CEO mới của Rosebud! Anh ta hiếm khi kết hợp được tài năng học máy và thẩm mỹ sản phẩm.


Martin Casado và nhóm a16z đã đồng hành suốt quá trình phát triển của Rosebud. Tôi và Martin đã có một cuộc trò chuyện quan trọng, bàn luận về việc liệu JavaScript có phải là công nghệ cơ bản đúng của trò chơi Rosebud không - chọn Unity hoặc Roblox có lẽ phổ biến hơn, nhưng tốc độ cải tiến mã nguồn JavaScript nhanh hơn nhiều do sự sẵn có của dữ liệu đào tạo. Đội ngũ này đang đuổi theo sự thật, sẵn lòng đặt cược vào những người dựng nên thêm. Đó là con đường tiến đến tương lai lý tưởng: chúng ta phải xây dựng, chúng ta phải sáng tạo.


Mong được tiếp tục làm việc chung với mọi người từ phía bàn là. Hộp thư tin nhắn của tôi luôn mở.


[Liên kết Bản gốc]



Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

举报 Báo lỗi/Báo cáo
Chọn thư viện
Thêm mới thư viện
Hủy
Hoàn thành
Thêm mới thư viện
Chỉ mình tôi có thể nhìn thấy
Công khai
Lưu
Báo lỗi/Báo cáo
Gửi