Tiêu đề gốc: "Sau khi đốt hàng chục tỷ USD Token, các ông lớn Silicon Valley bắt đầu hạn chế lượng Token sử dụng của nhân viên"
Tác giả gốc: Hoa Lâm Vũ Vương, Geek Park
Điều mà doanh nghiệp tự động hóa là "công việc nhân viên ghét", chứ không phải "công việc kiếm tiền".
Vài ngày trước, Geek Park đã đưa tin về việc Microsoft, công ty đặt cược lớn vào AI, đã âm thầm ngừng cấp phép Claude Code cho hầu hết nhân viên nội bộ.
Điều này rất kỳ lạ, bởi vì trong làn sóng triển khai AI lần này, điểm marketing lớn nhất dành cho doanh nghiệp là "nâng cao hiệu suất". Nếu có thể nâng cao hiệu suất, tại sao Microsoft lại ngừng cho nhân viên sử dụng Claude Code?
Microsoft không phải là công ty duy nhất làm điều này. "Thắt chặt lượng Token sử dụng", không còn khuyến khích nhân viên điên cuồng Vibe Coding, đã trở thành xu hướng mới của các ông lớn Silicon Valley.
Uber đã tiêu hết ngân sách AI token của cả năm trong vòng bốn tháng. Salesforce chi khoảng 300 triệu USD mỗi năm cho Anthropic. Một cố vấn AI tiết lộ rằng một khách hàng của anh ấy đã chi tới 500 triệu USD cho AI trong một tháng. Meta thậm chí đã âm thầm gỡ bỏ "bảng xếp hạng tokenmaxxing" nội bộ – bảng xếp hạng vốn được tạo ra để khuyến khích nhân viên sử dụng AI nhiều hơn.
Giờ đây, các doanh nghiệp đang làm một điều mà vài năm trước không ai dám nghĩ tới:
Hạn chế và giám sát nhân viên sử dụng AI.
Tại sao các ông lớn lại đồng loạt thay đổi?
Để hiểu cuộc khủng hoảng chi phí ngày nay, trước tiên cần hiểu "tokenmaxxing" là gì.
Thuật ngữ này bắt đầu phổ biến vào khoảng năm 2025, nghĩa đen là "tối đa hóa lượng token sử dụng". Đằng sau nó là một logic quản lý – vì công ty đã chi nhiều tiền mua công cụ AI, nhân viên nên sử dụng hết mình, càng dùng nhiều càng chứng tỏ bạn đang "chuyển đổi số", càng dùng ít là đang lãng phí tài nguyên. Vì vậy, nhiều công ty đặt ra hạn ngạch sử dụng, bảng xếp hạng, thậm chí cả đánh giá hiệu suất, thúc ép nhân viên sử dụng AI.
Kết quả ra sao?
Nhân viên bắt đầu dùng mô hình AI cấp doanh nghiệp để tra thời tiết, viết lời chúc sinh nhật, hỏi hôm nay ăn gì.
Một nghiên cứu trên 2.444 công ty cho thấy, cứ mỗi 1 đô la chi cho token AI, 0,44 đô la dùng để sửa lỗi do AI tạo ra, 0,27 đô la để viết lại code do AI sinh ra, 0,11 đô la tiêu hao do chậm trễ trong việc xem xét và hợp nhất.
Nói cách khác, đằng sau mỗi đồng chi phí mua AI, còn ẩn chứa gần 80% tổn thất ngầm.
Nhà đầu tư Shruti Gandhi dùng một phép so sánh rất chính xác: "Các công ty tokenmaxxing giống như một doanh nghiệp đo năng suất bằng cách bật hết đèn – tiêu nhiều tiền hơn không đồng nghĩa với sản lượng cao hơn."
Hầu hết các công ty này hoàn toàn không biết nhân viên đang dùng AI để làm gì, càng không biết liệu việc hoàn thành các nhiệm vụ đó có mang lại bất kỳ thay đổi nào nhờ AI hay không.
Cuộc "đua đốt tiền" này kéo dài từ năm 2024 sang 2025, và cuối cùng bùng nổ tập trung trong năm nay. JPMorgan đã đưa ra một báo cáo với ngôn từ gay gắt, tiêu đề thẳng thắn đến mức khó chịu – "Chi phí Token AI đang nuốt chửng lợi nhuận Internet".
Shopify, Spotify, ServiceNow, Roku trong các cuộc họp báo cáo tài chính đều đề cập rằng AI trở thành áp lực chính lên chi phí vận hành. Bầu không khí chung của ngành bắt đầu chuyển từ "dùng AI giỏi thế nào" sang "tiền này tiêu có đáng không".
Chỉ 14% CFO cho biết có thể thấy được lợi nhuận rõ ràng và đo lường được từ đầu tư AI.
Giám đốc vận hành của Uber, Andrew Macdonald, đã nói một câu rất thẳng thắn trong podcast – họ thấy khó kết nối sự cải thiện năng suất cá nhân của nhân viên với tác động kinh doanh tổng thể của công ty. "Nếu bạn không thấy AI giúp bạn đẩy bao nhiêu tính năng có giá trị đến người dùng, thì chi phí token càng khó biện minh."
Câu nói này chỉ ra cốt lõi của tình thế khó xử về AI trong doanh nghiệp: Cải thiện hiệu suất cá nhân không đồng nghĩa với tăng trưởng lợi nhuận công ty.
Nhân viên dùng AI viết báo cáo tuần nhanh gấp ba lần, nhưng doanh thu công ty không thay đổi. Kỹ sư dùng AI tạo code với tốc độ tăng gấp đôi, nhưng tỷ lệ "thất thoát" code – tức là code bị bỏ hoặc viết lại – tăng 800%.
Cựu Giám đốc AI của Microsoft, Sophia Velastegui, đã nói một câu khiến nhiều nhà quản lý khó chịu: "Hầu hết mọi người mặc định tự động hóa những nhiệm vụ họ không thích, thay vì những nhiệm vụ có giá trị nhất đối với công ty."
Nói thẳng ra, doanh nghiệp đang tự động hóa những "công việc nhân viên ghét", chứ không phải "công việc kiếm ra tiền".
Đây không phải vấn đề kỹ thuật, mà là vấn đề ưu tiên. Đó cũng là lý do tại sao khoảng 30% các dự án AI tạo sinh bị bỏ dở ngay ở giai đoạn chứng minh khái niệm – chi phí không rõ ràng, giá trị cũng không rõ ràng, sếp đương nhiên không gia hạn.
Cách xử lý của CEO Salesforce, Marc Benioff, khá tiêu biểu. Đối mặt với hóa đơn 300 triệu USD mỗi năm từ Anthropic, ông kỳ vọng vào một "bộ định tuyến thông minh": có thể xác định truy vấn nào đáng dùng mô hình cao cấp, truy vấn nào chỉ cần mô hình nhỏ giá rẻ là đủ.
Ý tưởng này tự nó không có gì mới – ngay từ thời đại điện toán đám mây, "trả tiền theo nhu cầu" và "tối ưu hóa tài nguyên" đã là thao tác tiêu chuẩn. Nhưng làn sóng AI này ập đến quá nhanh, mọi người cứ mua trước rồi mới nghĩ, giờ mới bắt đầu học bù.
Microsoft gần đây đã hủy bỏ hầu hết giấy phép doanh nghiệp cho Claude Code, với lý do chính thức liên quan đến yếu tố chi phí. Sự việc này đã gây ra không ít tranh luận trong ngành – dù sao Microsoft cũng là nhà đầu tư lớn nhất của OpenAI, đồng thời lại đang cắt giảm đăng ký của đối thủ cạnh tranh, khó mà nói rõ trong đó có bao nhiêu phần là cân nhắc chi phí, bao nhiêu phần là chiến lược.
Nhưng dù thế nào, nó cũng đại diện cho một tín hiệu: doanh nghiệp đã bắt đầu bỏ phiếu bằng chân.
Harness và CloudZero gần như trong cùng một ngày – 28 tháng 5 – đã lần lượt ra mắt các công cụ quản lý chi phí AI, một cái tập trung giám sát thời gian thực chi tiêu AI và ROI, cái kia tung ra "mặt phẳng kiểm soát tài chính AI", giúp doanh nghiệp liên kết từng đô la chi tiêu AI với kết quả kinh doanh cụ thể.
Sự xuất hiện của hai sản phẩm này tự nó đã nói lên vấn đề: thị trường có nhu cầu, và nhu cầu rất cấp bách.
HubSpot từ tháng 4 năm nay đã điều chỉnh mô hình định giá cho AI agent, không còn tính phí theo token nữa, mà chuyển sang tính phí theo "số cuộc hội thoại đã giải quyết" hoặc "số lead được tạo ra" – đây là một sự thay đổi mang tính định hướng, căn chỉnh lợi ích của người bán với sản lượng thực tế của người mua. ServiceNow cũng đang thực hiện những điều chỉnh tương tự. Các nhà cung cấp AI đang nhận ra rằng, nếu họ tiếp tục bán "lượng sử dụng" thay vì bán "kết quả", khách hàng doanh nghiệp sớm muộn sẽ phản ứng dữ dội.
Sự điều chỉnh này là cơn đau tất yếu mà ngành công nghiệp AI phải trải qua, hay là khởi đầu của một cuộc khủng hoảng lớn hơn?
Tôi có xu hướng cho rằng đó là trường hợp đầu tiên. Nhưng có một chi tiết khiến tôi hơi lo lắng: Chi tiêu toàn cầu cho phần mềm AI dự kiến đạt 2,59 nghìn tỷ USD vào năm 2026, tăng 47% so với cùng kỳ, nhưng đồng thời, 94% người phụ trách kỹ thuật cho biết các chỉ số ROI quan trọng vẫn còn thiếu. Tiền càng ngày càng đổ nhiều, nhưng không ai biết nó đang được đốt vào đâu và có đáng giá hay không – mâu thuẫn này nếu không được giải quyết, thì "khoảnh khắc tokenmaxxing" tiếp theo chỉ là vấn đề thời gian.
Một bài phân tích trên tạp chí Fortune đã nói rất thẳng thắn: "Tokenmaxxing rất dễ, nhưng thiết kế lại quy trình làm việc thì rất khó." Hầu hết các công ty hiện nay đang làm là tối ưu hóa các quy trình hiện có, chứ không phải phát minh lại mô hình kinh doanh. Đây chính là giá trị thực sự của AI, và cũng là nơi mà hầu hết các doanh nghiệp chưa chạm tới.
Sự quay trở lại hợp lý là điều tốt. Nhưng sau khi quay trở lại hợp lý, các doanh nghiệp còn phải trả lời một câu hỏi khó hơn: AI đối với hoạt động kinh doanh của chúng ta, rốt cuộc nên là một cái búa, hay một khung tư duy mới?
Nếu chỉ dùng AI để làm công việc cũ nhanh hơn, thì hóa đơn một ngày nào đó sẽ buộc bạn phải đối mặt với câu hỏi này.
Liên kết gốc
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia