· Giám đốc Uber thẳng thắn cho rằng mối liên kết giữa việc tiêu thụ Token và cải thiện sản phẩm thực tế "vẫn chưa tồn tại"; OpenAI cũng thừa nhận chi phí AI doanh nghiệp đang trở thành một vấn đề ngày càng thực tế.
· Nhu cầu AI không biến mất, nhưng các doanh nghiệp bắt đầu chuyển từ dùng thử sang kiểm toán ROI, các nhà sản xuất mô hình bắt đầu thảo luận về giảm giá, và độ co giãn tăng trưởng của đám mây, GPU và trung tâm dữ liệu cần được xác minh lại.
· Cổ phiếu liên quan: NVDA, MSFT, AMZN, GOOG, MU, AVGO, AMD, TSM, ARM, ORCL.
Thị trường chứng khoán AI của Mỹ, vốn đã tăng liên tiếp trong hai tháng, gần đây bắt đầu suy yếu và điều chỉnh, và thị trường cũng bắt đầu tìm kiếm nguyên nhân một cách công khai.
Lãi suất, định giá quá cao, biến động từ báo cáo tài chính đều có thể giải thích cho đợt điều chỉnh này, nhưng thị trường đang kiểm toán một giả định cơ bản hơn: Liệu việc doanh nghiệp tiêu thụ nhiều Token hơn có chắc chắn mang lại nhiều doanh thu, hiệu quả và lợi nhuận hơn hay không.
Trong hai năm qua, giao dịch AI có một chuỗi rất suôn sẻ. Doanh nghiệp sử dụng AI nhiều, mức tiêu thụ Token (đơn vị đo lường xử lý văn bản của mô hình) tăng, doanh thu của nhà cung cấp mô hình tăng, nhà cung cấp đám mây bán được nhiều sức mạnh tính toán hơn, và nhu cầu về GPU, HBM (bộ nhớ băng thông cao), máy chủ, trung tâm dữ liệu và điện năng tiếp tục mở rộng. Chỉ cần lượng sử dụng Token tiếp tục tăng, thị trường có thể hiểu đó là sự tăng tốc áp dụng AI và định giá cao hơn cho phần cứng thượng nguồn và chi tiêu vốn.
Nhưng một thay đổi gần đây là ngay cả các nhà cung cấp mô hình cũng bắt đầu thảo luận về vấn đề chi phí.
Theo báo cáo của The Wall Street Journal, OpenAI đang nghiên cứu giảm thêm giá gọi mô hình để đối phó với áp lực ngân sách doanh nghiệp và thách thức từ các đối thủ cạnh tranh như Anthropic. Đồng thời, CEO OpenAI Sam Altman gần đây công khai cho biết ngày càng nhiều doanh nghiệp bắt đầu coi chi phí AI là một vấn đề quan trọng, và một số khách hàng thậm chí đã tiêu hết ngân sách AI dự kiến cho cả năm trong quý đầu tiên.
Bản thân sự việc này có thể chưa đủ để thay đổi cục diện ngành, nhưng nó phát đi một tín hiệu đáng chú ý: Thị trường không chỉ thảo luận về năng lực mô hình nữa, mà còn về chi phí, định giá và tỷ suất hoàn vốn đầu tư.
Điều đang lung lay bây giờ không phải là "doanh nghiệp có còn sử dụng AI hay không", mà là "doanh nghiệp có sẵn sàng tiếp tục trả giá cao cho Token một cách vô điều kiện hay không".
Andrew Macdonald, Chủ tịch kiêm Giám đốc điều hành của Uber, đã nói trong podcast rằng mối liên kết giữa tăng trưởng tiêu thụ Token và "các tính năng hữu ích cho người tiêu dùng" "vẫn chưa tồn tại". Câu nói này đến từ phía người trả tiền, chứ không phải từ người bán, ngân hàng đầu tư hay các công ty khởi nghiệp mô hình.
Nếu trước đây thị trường tin rằng "lượng sử dụng là thành công", thì giờ đây đã bước vào giai đoạn thứ hai: Token cuối cùng có thể chuyển hóa thành tăng trưởng doanh thu, giảm chi phí nhân công hay cải thiện tỷ suất lợi nhuận hay không. Một khi vấn đề này được bộ phận tài chính đặt ra một cách có hệ thống, ngôn ngữ định giá của chuỗi ngành AI sẽ chuyển từ "nhu cầu vô hạn" sang "xác minh lợi nhuận".
Trường hợp của Uber đáng để xem xét, không phải vì họ không hiểu AI, cũng không phải vì họ không muốn sử dụng AI. Hoàn toàn ngược lại, tỷ lệ áp dụng các công cụ mã hóa AI nội bộ của Uber rất cao. Theo nhiều báo cáo truyền thông, trong số khoảng 5.000 kỹ sư của công ty, tỷ lệ sử dụng hàng tháng từng đạt từ 84% đến 95%, hóa đơn hàng tháng của mỗi kỹ sư dao động từ vài trăm đến 2.000 USD.
Vấn đề nằm ngay ở đây. Khi tỷ lệ sử dụng đủ cao, hóa đơn không còn là chi phí thử nghiệm nhỏ của bộ phận đổi mới, mà trở thành chi phí thực tế cần được giải trình bởi bộ phận vận hành. Theo tiết lộ trước đây của CTO công ty, ngân sách Claude Code cả năm của Uber đã được sử dụng hết trong vòng 4 tháng. Macdonald mô tả đây là một khoảnh khắc "đau đầu".
Trong nội bộ doanh nghiệp, các công cụ AI thường được đưa vào ngân sách với danh nghĩa "nâng cao hiệu quả". Kỹ sư tạo mã nhanh hơn, nhân viên chăm sóc khách hàng trả lời nhanh hơn, đội vận hành viết báo cáo nhanh hơn – đây đều là những thay đổi dễ nhận thấy.
Nhưng khi quy mô sử dụng mở rộng, bộ phận tài chính sẽ nhìn vào những câu hỏi cứng hơn: Có mang lại thêm doanh thu không? Có giảm chi phí nhân công thực tế không? Có cải thiện tỷ suất lợi nhuận không?
Hiện tượng "tokenmaxxing" mà Macdonald đề cập cũng cho thấy lượng sử dụng cao có thể tách rời khỏi giá trị cao. Tokenmaxxing là hiện tượng các nhóm hoặc cá nhân tiêu thụ Token ồ ạt để tối đa hóa việc sử dụng công cụ AI. Dữ liệu sử dụng trông có vẻ tốt, nhưng chưa chắc tương ứng với kết quả sản phẩm tốt hơn. Đối với nhà cung cấp dịch vụ AI, đây là doanh thu; đối với doanh nghiệp, nó có thể chỉ là một hóa đơn đám mây mất kiểm soát khác.
Tín hiệu từ Uber đáng được chú ý hơn là câu chuyện "công cụ AI quá đắt" thông thường.

Nó không nói rằng AI vô dụng, mà nói rằng khi AI chuyển từ ngân sách thử nghiệm sang ngân sách vận hành, doanh nghiệp cần chứng minh mỗi đô la chi cho Token mang lại kết quả kinh doanh có thể đo lường được. Tỷ lệ áp dụng cao không còn tự động đồng nghĩa với thành công, mà ngược lại, nó sẽ bộc lộ cấu trúc chi phí trước tiên.
Các doanh nghiệp mua hàng bắt đầu tính toán chi phí, và các nền tảng cũng đang thay đổi cách thức tính phí.
GitHub đã thông báo rằng, từ ngày 1 tháng 6 năm 2026, Copilot sẽ chuyển sang mô hình tính phí theo mức sử dụng và giới thiệu AI Credits (hạn mức sử dụng AI) hàng tháng. Đối với người dùng nhẹ, điều này có thể chỉ là sự thay đổi trong cấu trúc hóa đơn; nhưng đối với các nhà phát triển thường xuyên sử dụng tính năng tác nhân thông minh, một số người dùng nặng phản ánh rằng chi phí cho một phiên làm việc có thể lên tới hàng chục đô la, và các cuộc thảo luận trong cộng đồng cũng trở nên sôi nổi hơn.
Ý nghĩa của sự việc này là, các nền tảng không còn sẵn sàng gói gọn hoàn toàn chi phí Token sử dụng không giới hạn vào phí đăng ký cố định.

Trước đây, người dùng trả phí hàng tháng, và nền tảng chịu chi phí gọi mô hình phía sau. Giờ đây, khi số lần gọi tác nhân thông minh, độ dài ngữ cảnh và nhiệm vụ đa vòng tăng lên, áp lực chi phí bắt đầu được hiện thực hóa. Dùng càng nhiều, trả càng nhiều – đây là một sự điều chỉnh đối với câu chuyện "AI không giới hạn".
Đáng chú ý hơn, áp lực này đã lan truyền từ tầng ứng dụng xuống tầng mô hình.
Trong hai năm qua, câu chuyện chính của ngành mô hình lớn luôn là giảm chi phí, tăng hiệu quả và mở rộng quy mô. Nhưng khi các bộ phận mua hàng của doanh nghiệp bắt đầu kiểm toán ROI, các nhà cung cấp mô hình cũng phải đối mặt với vấn đề mới: nếu khách hàng không sẵn sàng tiếp tục trả tiền cho Token giá cao, thì tăng trưởng sẽ dựa vào đâu?
Tín hiệu gần đây từ OpenAI rất điển hình. Một mặt, Sam Altman thừa nhận ngân sách doanh nghiệp đang chịu áp lực; mặt khác, thị trường đồn đoán OpenAI đang nghiên cứu các phương án giảm giá thêm. Điều này có nghĩa là trọng tâm của ngành đang chuyển từ "năng lực mô hình có dẫn đầu không" sang "chi phí thông minh trên mỗi đơn vị có đủ thấp không".
Đối với khách hàng doanh nghiệp, vấn đề quan trọng nhất không còn là mô hình nào mạnh nhất, mà là mô hình nào có thể tạo ra nhiều kết quả kinh doanh hơn trong cùng một ngân sách.
Việc Microsoft cắt giảm giấy phép Claude Code nội bộ cũng nằm trong cùng một hướng đi. Theo các báo cáo từ The Verge, Axios, TechRadar và các phương tiện truyền thông khác, bộ phận Experiences & Devices của Microsoft đã hủy bỏ hầu hết giấy phép Claude Code nội bộ và chuyển sang công cụ Copilot của riêng mình. Quy mô và lý do cụ thể vẫn cần được tiết lộ thêm, không thể kết luận trực tiếp rằng Microsoft đã xác nhận cắt giảm mua sắm công cụ bên ngoài vì chi phí.
Nhưng hành động này ít nhất cho thấy, các công ty công nghệ lớn cũng đang tự phân bổ lại chi phí gọi mô hình bên ngoài.
Tác động của điều này đối với chuỗi ngành AI không nằm ở việc doanh thu của một công cụ nào đó giảm bao nhiêu, mà ở chỗ kỷ luật của bên mua bắt đầu lan truyền ngược lên. Doanh nghiệp có thể giới hạn hạn mức, chọn mô hình rẻ hơn, chuyển một phần nhiệm vụ sang các giải pháp mã nguồn mở hoặc tự xây dựng, hoặc yêu cầu nhà cung cấp giảm giá. Các nhà cung cấp mô hình và công ty tầng ứng dụng vẫn sẽ có nhu cầu, nhưng quyền định giá không còn chỉ do "mô hình mạnh hơn" quyết định, mà còn do "khách hàng có tính toán được lợi ích hay không" quyết định.
Các nhà cung cấp dịch vụ đám mây cũng sẽ bị ảnh hưởng. Trước đây, câu chuyện về phần AI trong doanh thu đám mây rất mạnh mẽ: đào tạo mô hình, suy luận và ứng dụng doanh nghiệp đều cần sức mạnh tính toán, lượng Token sử dụng càng nhiều, nhu cầu đám mây càng chắc chắn. Nhưng nếu doanh nghiệp bắt đầu ép giảm chi phí trên mỗi đơn vị Token, hoặc chuyển các tác vụ tần suất cao, giá trị thấp sang các đường dẫn suy luận rẻ hơn, thì độ co giãn doanh thu của các nhà cung cấp đám mây có thể thấp hơn kỳ vọng trước đây của thị trường.
Một lý do doanh nghiệp bắt đầu kiểm toán vào thời điểm này là việc sử dụng AI đã bước vào giai đoạn mẫu đủ lớn, và các phần kém hiệu quả không còn dễ bị bỏ qua.
Nghiên cứu do Entelligence.AI công bố vào tháng 5 năm 2026 đã phân tích 2.444 tổ chức và hơn 1 triệu Pull Request. Theo tính toán của họ, trong mỗi 1 đô la chi phí Token AI, chỉ có 0,18 đô la tạo ra giá trị thực tế tiếp cận người dùng, 0,44 đô la dùng để sửa lỗi do AI gây ra, 0,27 đô la dùng cho việc làm lại, và 0,11 đô la tiêu hao trong ma sát đánh giá.
Dữ liệu này không thể được viết thành kết luận cho toàn ngành. Nó đến từ trang nghiên cứu riêng của nhà cung cấp, chủ yếu phản ánh các kịch bản kỹ thuật phần mềm, không phải kiểm toán độc lập hay bài báo học thuật. Nhưng nó đủ để minh họa một vấn đề: phía doanh nghiệp thực sự tồn tại áp lực kiểm toán ROI, đặc biệt là trong các kịch bản mà nội dung do AI tạo ra vẫn cần con người xem xét, sửa chữa và tích hợp.

Điều dễ dàng nhất mà các công cụ AI thể hiện là tốc độ tạo ra, nhưng doanh nghiệp thực sự trả tiền để mua kết quả có thể bàn giao. Nếu mã do AI tạo ra mang lại nhiều lỗi hơn, cần nhiều đánh giá, làm lại và kiểm thử hơn sau đó, thì thời gian tiết kiệm ở phía trước sẽ xuất hiện trở lại ở phía sau. Đối với người dùng cá nhân, điều này có thể chỉ là vấn đề trải nghiệm; đối với doanh nghiệp lớn, nó trở thành vấn đề tài chính và vấn đề quản lý tổ chức.
Điều này cũng giải thích tại sao tăng trưởng lượng sử dụng Token không thể đơn giản được coi là thành công của AI.
Token là đơn vị tính doanh thu, cũng là đơn vị đo chi phí. Đối với các nhà cung cấp mô hình, nhiều Token hơn đồng nghĩa với nhiều doanh thu hơn; đối với doanh nghiệp, nhiều Token hơn chỉ đáng là một khoản ngân sách mở rộng liên tục khi nó mang lại nhiều doanh thu hơn, chi phí thấp hơn hoặc tỷ suất lợi nhuận cao hơn.
Nếu trước đây thị trường coi tăng trưởng Token là chỉ báo hàng đầu cho nhu cầu phần cứng, thì bây giờ cần bổ sung nửa còn lại: tỷ lệ chuyển đổi giá trị của Token. Chỉ khi lượng Token tiêu thụ có thể ổn định chuyển hóa thành kết quả kinh doanh, thì doanh thu AI của các nhà cung cấp đám mây, đơn đặt hàng GPU, mở rộng sản xuất HBM và xây dựng trung tâm dữ liệu mới có sự hỗ trợ đầu cuối vững chắc hơn.
Chiến lược gia vĩ mô Andreas Steno Larsen gần đây chỉ ra rằng Chỉ số Chi tiêu Token LLM (LLM Token Expenditure Index) liên quan đến Silicon Data là một trong những biểu đồ đáng theo dõi trên thị trường hiện tại. Các báo cáo liên quan cho thấy chỉ số này theo dõi mức chi tiêu hoặc giá mà doanh nghiệp trả cho mỗi triệu Token. Sau khi tăng rõ rệt vào đầu năm 2026, chỉ số này đã có dấu hiệu giảm vào cuối tháng 5.
Cần giữ ranh giới ở đây. Trang công khai của Silicon Data chủ yếu là giới thiệu sản phẩm, phương pháp chỉ số và dữ liệu lịch sử đầy đủ chưa được công bố rộng rãi. Nó không thể được coi là kết luận cứng, nhưng có thể là một tín hiệu để quan sát sự thay đổi trong ý định chi trả của doanh nghiệp.
Chỉ số chi tiêu Token giảm không đồng nghĩa với việc sử dụng AI giảm.
Thực tế, thị trường hiện tại dường như đang chứng kiến sự chuyển đổi của ngành AI từ "cạnh tranh sức mạnh tính toán" sang "cạnh tranh chi phí thông minh trên mỗi đơn vị". Doanh nghiệp vẫn cần AI, nhưng không nhất thiết sẵn sàng tiếp tục mua AI theo hệ thống giá cũ.
Nếu OpenAI cuối cùng khởi động một đợt điều chỉnh giá mới, thì áp lực ngân sách từ phía doanh nghiệp sẽ giảm bớt, đồng thời cũng có nghĩa là ngành mô hình chính thức bước vào giai đoạn cạnh tranh giá. Khi đó thị trường cần đánh giá lại: tăng trưởng trong tương lai đến từ nhu cầu mới, hay từ sự mở rộng khối lượng sử dụng sau khi giá giảm.
Nhu cầu AI vẫn có thể tăng, nhưng hàm lượng giá trị của doanh thu tăng trưởng và độ co giãn truyền dẫn ngược dòng có thể thay đổi.
Tác động này không giống nhau đối với các khâu khác nhau. Lớp ứng dụng và lớp mô hình trước tiên phải đối mặt với áp lực giá: doanh nghiệp sẽ yêu cầu ROI rõ ràng hơn, giảm các cuộc gọi giá trị thấp, hoặc chuyển đổi chi phí giữa các mô hình khác nhau.
Các nhà cung cấp đám mây đối mặt với vấn đề co giãn doanh thu: cùng một khối lượng sử dụng, nếu giá đơn vị giảm, bộ nhớ đệm và xử lý hàng loạt tăng, và các giải pháp tự xây dựng tăng lên, thì tốc độ tăng trưởng doanh thu AI đám mây có thể không đẹp bằng tốc độ tăng tổng lượng Token.
Xa hơn về thượng nguồn, GPU, HBM, đóng gói tiên tiến, máy chủ và xây dựng trung tâm dữ liệu giao dịch dựa trên chi tiêu vốn trong tương lai. Nếu kỷ luật chi trả từ phía doanh nghiệp khiến các nhà cung cấp mô hình và đám mây thận trọng hơn về doanh thu tương lai, thì đơn đặt hàng phần cứng và nhịp độ xây dựng trung tâm dữ liệu sẽ được đánh giá lại.
Cảnh báo của Larsen không phải là nhu cầu phần cứng sẽ biến mất ngay lập tức, mà là nếu định giá Token tiếp tục yếu đi, thị trường sẽ bắt đầu nghi ngờ độ dốc của chu kỳ đầu tư cơ sở hạ tầng AI lần này.

Giữa đợt điều chỉnh của cổ phiếu AI và việc kiểm toán hóa đơn Token, không phải là mối quan hệ nhân quả đơn giản. Không thể nói cổ phiếu chip giảm chỉ vì Uber đã đốt hết ngân sách, nhưng chúng nằm trên cùng một chuỗi: khi định giá đã phản ánh mức tăng trưởng cao dài hạn, bất kỳ tín hiệu nào về khả năng chi trả cuối cùng và ROI đều sẽ bị khuếch đại thành sự đánh giá lại chi tiêu vốn thượng nguồn.
Bằng chứng hiện tại chưa thể ủng hộ quan điểm "bong bóng AI đã vỡ". Doanh nghiệp chưa ngừng sử dụng AI, và các nhà phát triển cũng sẽ không quay lại trạng thái không có Copilot, Claude hoặc các công cụ tác tử thông minh khác. Một nhận định hợp lý hơn là, việc áp dụng AI đang chuyển từ giai đoạn cuồng nhiệt ban đầu sang giai đoạn kỷ luật ngân sách, thị trường bắt đầu phân biệt trường hợp sử dụng nào chứng minh được lợi nhuận, và trường hợp nào chỉ tạo ra hóa đơn.
Xác nhận quan trọng nhất tiếp theo, không phải là tìm một công ty khác để nói AI quá đắt, mà là xem ngôn ngữ trong báo cáo tài chính của các nhà cung cấp đám mây và công ty phần mềm có thay đổi hay không. Tốc độ tăng trưởng doanh thu AI đám mây của Microsoft, Amazon, Google có tiếp tục duy trì độ co giãn cao hay không; sau khi các công cụ doanh nghiệp như Copilot, Claude Code chuyển sang tính phí theo mức sử dụng, tỷ lệ gia hạn, hạ cấp và khiếu nại thay đổi như thế nào; tất cả những điều này sẽ phản ánh rõ hơn so với biến động giá cổ phiếu trong một ngày liệu kỷ luật bên mua có đang được tăng cường một cách có hệ thống hay không.
Về phía phần cứng, cần xem xét liệu có dấu hiệu điều chỉnh giảm trong các đơn đặt hàng GPU, HBM và trung tâm dữ liệu hay không. Chỉ cần chi tiêu vốn của các nhà cung cấp đám mây tiếp tục được điều chỉnh tăng và đơn đặt hàng chip tiên tiến vẫn căng thẳng, thì sự suy giảm ý định chi trả Token giống như một sự điều chỉnh lành mạnh hơn. Nếu độ co giãn doanh thu AI đám mây suy yếu, đồng thời đơn đặt hàng thượng nguồn và nhịp độ xây dựng trung tâm dữ liệu bắt đầu chậm lại, thì thị trường mới có thể định giá nó như một điểm uốn chu kỳ sâu hơn.
Giao dịch AI chưa kết thúc, nhưng ngôn ngữ định giá của nó đang thay đổi. Trước đây thị trường hỏi "đã sử dụng bao nhiêu Token", bây giờ câu hỏi là "những Token này cuối cùng đã tạo ra bao nhiêu lợi nhuận". Khoảng cách này sẽ quyết định hướng phân hóa định giá của chuỗi ngành AI trong tương lai.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia