TL;DR
· Câu chuyện "Fat Models" cho rằng các công ty mô hình có thể tích hợp ngược lên API, công cụ, khung Agent và cổng ứng dụng.
· Nhưng tác nhân thông minh cần thực thi tác vụ xuyên suốt dữ liệu, công cụ, danh tính, thanh toán và hệ thống doanh nghiệp, không thể chỉ được xem như bản nâng cấp của hộp chat.
· Các ông lớn mô hình vẫn nắm giữ lợi thế về sức mạnh tính toán, vốn, mô hình và phân phối, nhưng các khâu như điều phối, bộ nhớ, định tuyến, danh tính có thể để lại khoảng trống cho các công ty khởi nghiệp.
Trong kỷ nguyên AI Agent, liệu các công ty mô hình như OpenAI, Anthropic, Google có tiếp tục thâu tóm ngược lên API, công cụ, khung tác nhân thông minh, ứng dụng doanh nghiệp và cổng tiêu dùng như thị trường kỳ vọng hay không?
Đây chính là phán quyết cốt lõi của câu chuyện "Fat Models": Nếu các mô hình tiên tiến đóng tiếp tục tiến bộ nhanh chóng và tích hợp ngược lên qua phân phối và chuỗi công cụ, phần lớn giá trị của ngành AI có thể chảy về tầng mô hình. Nhưng một phán quyết khác là, khi AI bước từ ứng dụng chat vào kỷ nguyên tác nhân thông minh, giá trị không nhất thiết chỉ đọng lại trong tay các công ty mô hình, mà có thể lan tỏa ra nhiều tầng cơ sở hạ tầng mới.
Lộ trình của các công ty mô hình lớn không khó hiểu: Đầu tiên sở hữu mô hình nền tảng tiên tiến nhất, sau đó đóng gói năng lực thành API, công cụ phát triển và khung tác nhân thông minh, cuối cùng tiến vào ứng dụng tiêu dùng và quy trình làm việc doanh nghiệp. Chỉ cần mô hình đủ mạnh, trải nghiệm, dữ liệu và hệ sinh thái nhà phát triển ở tầng trên có thể hội tụ về nền tảng mô hình.
Đây cũng là lý do quan trọng khiến vốn sẵn sàng định giá cao cho các công ty AI hàng đầu. Báo cáo tháng 5 của Reuters cho thấy, sau khi Anthropic hoàn thành vòng gọi vốn Series H trị giá 65 tỷ USD, định giá sau đầu tư đạt 965 tỷ USD. Vòng gọi vốn mới nhất của OpenAI được công bố vào tháng 3 năm nay có định giá sau đầu tư là 852 tỷ USD. Vốn hóa thị trường của Alphabet cũng đã vượt 4 nghìn tỷ USD, gấp hơn ba lần so với cuối năm 2022. Thị trường đang đặt cược với mức định giá cực cao vào khả năng cổng vào và lợi nhuận của tầng mô hình trong tương lai.
Nhưng liệu lợi thế mô hình có đủ để các công ty này đồng thời sở hữu giá trị của mọi tầng phía trên hay không vẫn còn gây tranh cãi. Mô hình tiên tiến, sức mạnh tính toán, đội ngũ nghiên cứu, cơ sở hạ tầng đám mây và nguồn lực khách hàng doanh nghiệp thực sự tập trung trong tay một số ít công ty; nhưng một khi tác nhân thông minh bước vào quy trình làm việc thực tế, chuỗi giá trị sẽ không còn chỉ xoay quanh "mô hình nào mạnh nhất".
Nhiều chu kỳ công nghệ đã chứng kiến những thay đổi tương tự. IBM từng biến máy tính lớn thành hệ thống tích hợp phần cứng, phần mềm, dịch vụ, sau đó hệ sinh thái PC đã chia tách nó; Microsoft từng kiểm soát desktop, Web đã mở ra cổng ứng dụng mới; các nhà mạng từng sở hữu mạng lưới tích hợp dọc, Internet đã tách rời dịch vụ mạng; AWS đã tạo ra nền tảng đám mây trị giá hơn 100 tỷ USD, nhưng phía trên đám mây vẫn mọc lên vô số công ty phần mềm độc lập.
Những phép so sánh này không nhằm nói rằng "nền tảng lớn chắc chắn sẽ thua", mà là một chu kỳ công nghệ sau khi hoàn thiện hạ tầng, giá trị thường có xu hướng lan tỏa từ nền tảng tích hợp duy nhất sang các lớp chuyên môn hóa hơn.
Sự thay đổi then chốt trong hệ sinh thái Agent là AI không chỉ trả lời câu hỏi, mà bắt đầu đảm nhận các nhiệm vụ. Xoay quanh stack Agent, nhiều lớp như mô hình, điều phối, bộ nhớ, thực thi, danh tính, thanh toán đều có thể hình thành giá trị độc lập. Các công ty khác nhau sẽ kết hợp và cạnh tranh ở từng lớp, thay vì phụ thuộc hoàn toàn vào cùng một nền tảng mô hình.
Sự thay đổi đầu tiên hỗ trợ nhận định này là nguồn cung mô hình đang gia tăng. Các mô hình tiên tiến vẫn dẫn đầu, nhưng các mô hình trọng số mã nguồn mở, mô hình biên và mô hình thương mại cũng liên tục xuất hiện. Các mô hình khác nhau có sự khác biệt về năng lực, độ trễ và chi phí. Đối với nhiều khối lượng công việc thương mại, doanh nghiệp và nhà phát triển sẽ kết hợp giữa chi phí, tốc độ, độ ổn định và chất lượng nhiệm vụ, thay vì mặc định gửi tất cả yêu cầu đến mô hình đắt nhất và mạnh nhất.
Sự thay đổi thứ hai là các kịch bản ứng dụng AI quá phân tán. Một công ty mô hình có thể tạo ra ứng dụng chat tổng quát, hoặc thâm nhập vào các cổng lớn như văn phòng, mã nguồn, tìm kiếm, nhưng Agent muốn thực sự đi vào các quy trình cụ thể như y tế, tài chính, sản xuất, pháp lý, dịch vụ khách hàng, mua sắm, hậu cần, mỗi ngành đều có cấu trúc dữ liệu, yêu cầu tuân thủ, thói quen vận hành và giao diện hệ thống riêng. Một công ty duy nhất khó có thể tạo ra sản phẩm phù hợp nhất trong mọi kịch bản.
Môi trường sản xuất doanh nghiệp cũng sẽ củng cố sự phân tách này. Ở giai đoạn thử nghiệm, doanh nghiệp có thể chấp nhận một bản demo mô hình hoặc công cụ chat khép kín. Một khi bước vào quy trình quan trọng, khách hàng sẽ yêu cầu lưu trữ dữ liệu, quản lý quyền, hồ sơ kiểm toán, kiểm soát chi phí, khả năng thay thế nhà cung cấp và chứng nhận tuân thủ. Lúc này, doanh nghiệp mong muốn lắp ráp các thành phần phù hợp hơn là bị buộc phải chấp nhận lựa chọn mặc định của một nền tảng duy nhất.
Đây cũng là điểm khác biệt chính giữa Agent và ứng dụng chat truyền thống. Một Agent y tế có thể cần đọc hồ sơ bệnh án, kiểm tra tương tác thuốc, gọi hệ thống bệnh viện, tạo đề xuất và để lại hồ sơ kiểm toán. Một Agent mua sắm doanh nghiệp có thể cần kết nối kho hàng, hợp đồng, luồng phê duyệt, hệ thống nhà cung cấp và mạng thanh toán. Chúng giống như những "người thực thi" di chuyển giữa nhiều dịch vụ, hơn là công cụ hỏi đáp chạy trong một cửa sổ duy nhất.
Hạ tầng Agent có thể được chia thành nhiều hướng: điều phối, harness, bộ nhớ, trình duyệt, định tuyến, thị trường mô hình, danh tính và thanh toán. Nói thẳng hơn, các lớp này tương ứng với: cách quản lý nhiều Agent, cách kết nối mô hình với công cụ thực tế, cách lưu trữ và chia sẻ ngữ cảnh, cách con người tương tác với Agent, yêu cầu nên gửi đến mô hình nào, cách chứng minh danh tính Agent, và cách Agent hoàn tất thanh toán.
Lớp điều phối có thể trở thành bảng điều khiển của kỷ nguyên tác nhân thông minh. Khi một doanh nghiệp vận hành đồng thời nhiều tác nhân thông minh, chúng cần được triển khai, giám sát, ủy quyền, cộng tác và cũng cần được kiểm soát rủi ro. Một API mô hình đơn lẻ khó có thể giải quyết vấn đề quản lý quy trình hoàn chỉnh.
Harness có thể hiểu là "vỏ bọc thực thi" của mô hình. Nếu mô hình lớn là bộ não, thì harness chịu trách nhiệm kết nối nó với tệp tin, cơ sở dữ liệu, trang web, robot, phần mềm doanh nghiệp và thiết bị vật lý. Các tình huống khác nhau cần các cách kết nối công cụ khác nhau, điều này sẽ thúc đẩy sự ra đời của các sản phẩm chuyên biệt hơn.
Lớp bộ nhớ xử lý vấn đề chuyển đổi ngữ cảnh. Khi nhiều tác nhân thông minh cần hiểu cùng một người dùng, cùng một doanh nghiệp hoặc cùng một nhiệm vụ, ngữ cảnh không thể bị khóa trong một cửa sổ trò chuyện duy nhất. Ai có thể cung cấp bộ nhớ kỹ thuật số có thể di chuyển, ủy quyền và kiểm toán, người đó có thể trở thành cơ sở hạ tầng mới.
Giá trị của định tuyến và thị trường mô hình đến từ việc triển khai đa mô hình. Nếu doanh nghiệp sử dụng nhiều mô hình cùng lúc, cần xác định loại nhiệm vụ nào phù hợp với mô hình nào hơn, cách cân bằng giữa chi phí, độ trễ và độ chính xác. Do đó, cạnh tranh mô hình không chỉ là cạnh tranh trên bảng xếp hạng, mà còn trở thành vấn đề điều phối trong môi trường sản xuất thực tế.
Danh tính và thanh toán thiên về tương lai hơn, nhưng liên quan đến việc tác nhân thông minh có thể thực sự thực hiện giao dịch hay không. Khi lưu lượng máy và hành vi của tác nhân thông minh gia tăng, mạng lưới cần phân biệt ai đang gửi yêu cầu, liệu nó có được ủy quyền hay không và có thể hoàn tất thanh toán hay không. Nếu tác nhân thông minh muốn tham gia vào thương mại điện tử, đăng ký, vi thanh toán hoặc mua sắm doanh nghiệp, các hệ thống thanh toán và danh tính hiện tại dành cho con người cũng có thể cần được cải tạo.
Ranh giới của lối kể chuyện mô-đun hóa này cũng rất rõ ràng. Nó không nói rằng các công ty mô hình lớn sẽ mất đi quyền lực thống trị. Mô hình tiên tiến vẫn là nền tảng của trải nghiệm AI, sức mạnh tính toán, dữ liệu, đội ngũ nghiên cứu và khả năng phân phối vẫn tập trung trong tay một số ít ông lớn. Nếu khả năng của mô hình tiếp tục tạo ra khoảng cách lớn nhanh chóng, hệ sinh thái thượng tầng vẫn có thể tập trung xung quanh các nền tảng hàng đầu.
Sự khác biệt thực sự nằm ở chỗ, liệu giá trị của kỷ nguyên tác nhân thông minh có tập trung như giai đoạn ứng dụng trò chuyện hay không. Khi AI bước vào quy trình làm việc thực tế, người dùng không chỉ quan tâm "mô hình nào thông minh nhất", mà còn bao gồm khả năng kết nối với hệ thống cũ, khả năng thay đổi nhà cung cấp, khả năng kiểm soát chi phí, khả năng kiểm toán và khả năng hoàn thành nhiệm vụ xuyên suốt các công cụ.
Điều này để lại không gian cho các công ty khởi nghiệp độc lập, nhưng không có nghĩa là mỗi lớp đều sẽ phát triển thành một công ty lớn. Các hướng như điều phối, bộ nhớ, danh tính, thanh toán, trình duyệt và định tuyến cuối cùng đều phải chứng minh rằng chúng có đủ khả năng thu hút người dùng, hiệu ứng mạng lưới hoặc khả năng thu phí mạnh mẽ, nếu không rất dễ trở thành một tính năng của nền tảng mô hình.
Các ông lớn mô hình lớn đang tích hợp khả năng lên trên, trong khi các công ty khởi nghiệp và nhà đầu tư đặt cược rằng hệ sinh thái tác nhân thông minh sẽ tách ra nhiều lớp chuyên biệt hơn. Câu hỏi cốt lõi chưa có lời giải của kỷ nguyên AI Agent là: Liệu mô hình sẽ trở thành nền tảng siêu hạng nuốt trọn toàn bộ stack, hay trở thành điểm khởi đầu cho một vòng cơ sở hạ tầng mô-đun hóa mới?
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia