Trong vòng hai năm qua, các lĩnh vực liên quan đến chuỗi cung ứng AI trên thị trường chứng khoán Mỹ đã tạo ra hàng chục nghìn tỷ đô la giá trị vốn. Tuy nhiên, phân phối thị trường mới đã tạo ra là rất không đồng đều: NVIDIA, một công ty có vốn hóa 4,5 nghìn tỷ đô la, tỷ suất lợi nhuận gộp 73%; Doanh thu hàng năm của OpenAI và Anthropic cộng lại chỉ khoảng 450 tỷ đô la; Các công ty ở tầng giữa và hạ giữa như CoreWeave, Cursor, Perplexity đều đang huy động vốn và tiêu tiền. Ngành công nghiệp AI đã biến thành một cấu trúc hình tam giác: càng lên tầng cao hơn, tỷ suất lợi nhuận càng dày.
Những nơi tiền thực sự chảy vào đâu và sẽ chảy vào đâu sau 10 năm nữa? Đó là câu hỏi cốt lõi mà khoa học MS&E 435 mới mở tại Stanford trong học kỳ này cố gắng giải thích. Điều hành là Apoorv Agrawal từ công ty đầu tư Altimeter, ông đã mời đến chín cá nhân chủ chốt trong ngành, cố gắng từ quan điểm của các nhà lãnh đạo ngành ghép lại tương lai của giá trị ngành công nghiệp AI.
Vào đầu năm 2024, Agrawal đã công bố một bài báo mang tựa đề "The Economics of Generative AI," kết luận rằng tầng chip đã tham chiếm 83% tỷ suất lợi nhuận của toàn bộ chuỗi cung ứng.

Sau hai năm, toàn bộ quy mô sinh thái đã mở rộng từ 900 tỷ đô la lên 4.350 tỷ. Tầng chip vẫn giữ vững thị phần tỷ suất lợi nhuận, từ 83% giảm xuống còn 79%.
Xem xét chi tiết, doanh thu hàng năm của tầng chip khoảng 3.000 tỷ đô la, NVIDIA một mình đã chiếm 80%; Tầng cơ sở khoảng 750 tỷ; Tầng ứng dụng khoảng 600 tỷ. Tỷ suất lợi nhuận của ba tầng lần lượt là 73%, 55%, 33%. Chuyển đổi thành giá trị lợi nhuận tuyệt đối, theo thứ tự là 2.250 tỷ, 400 tỷ, 200 tỷ đô la.

Bức tranh lợi nhuận của ngành công nghiệp AI, ngược lại hoàn toàn với ngành công nghệ trước đó đã đẩy mạnh là ngành điện toán đám mây, trong chuỗi cung ứng điện toán đám mây truyền thống, tầng chip chỉ chiếm 6% tỷ suất lợi nhuận, tầng ứng dụng chiếm 70%.

Agrawal đã tổng kết sắc bén về cấu trúc cạnh tranh hiện tại: tầng chip là trò chơi đơn người, tầng ứng dụng là trò chơi đôi, còn tầng cơ sở ở giữa là một trận đấu đa người duy nhất đang diễn ra.
Bài học thứ hai được dẫn dắt bởi đối tác của Altimeter Brad Gerstner và Sunny Madra của NVIDIA. Sunny trước đây là nhà đầu tư của Groq, đã tham gia đàm phán để Groq được NVIDIA mua lại, hai người này giải thích vì sao NVIDIA sẽ tiếp tục độc tôn ở tầng chip.

Brad đã đưa ra một ước lượng đầy mâu thuẫn: NVIDIA có giá trị vốn hóa 4.5 nghìn tỷ USD, P/E ratio là 13 lần, chỉ đạt một nửa giá trị trung bình thị trường, và tỷ lệ tăng trưởng doanh thu hàng năm là 70%. Anh ấy công khai dự đoán rằng NVIDIA sẽ trở thành công ty đạt 1 nghìn tỷ USD vốn hóa đầu tiên trên thế giới. Lý do của anh ấy là, trong tám quý tiếp theo, NVIDIA đã có đơn hàng tỷ đô đầy tòan tâm, nhu cầu vượt xa cung cấp. Hwang In-hyuk đã từng nói với Brad rằng, giải thích nhu cầu sẽ tăng gấp 10 tỷ lần.
Đằng sau sự tự tin này là logic công nghệ từ huấn luyện trước tới thời đại suy luận - lượng tính toán để tạo ra một token, bằng số lượng tham số mô hình nhân với bình phương độ dài ngữ cảnh.
Có không ít đối thủ sản xuất chip tự nghiên cứu. Thế hệ TPU thứ 7 của Google, Ironwood, đã bắt đầu sản xuất hàng loạt, Anthropic đã đặt hàng 1 triệu chiếc, có tin đồn cho rằng điều này đã trực tiếp buộc NVIDIA giảm giá cho một số khách hàng 30%; Chip Trainium2 của Amazon đã triển khai 1.4 triệu thực thể, doanh thu hàng năm liên quan đã vượt mốc 10 tỷ USD; Maia 200 của Microsoft đã ra mắt trên Azure vào tháng 1 năm nay, OpenAI cũng đã ký hợp đồng với Broadcom về 10 GW đơn vị tự nghiên cứu ASIC.

Hwang In-hyuk nhẹ nhàng nhận xét về điều này: "Rất nhiều dự án ASIC cuối cùng sẽ bị hủy." Nhìn từ quá khứ, anh ấy không sai. Và ngay cả khi TPU, Trainium, Maia đều thành công, NVIDIA vẫn là người dẫn đầu. Tất cả những điều trên không chứng tỏ rằng NVIDIA không thể thay thế được, điều đó chỉ chứng tỏ thị trường này có quy mô lớn đến mức nào.
Diễn giả của bài giảng thứ ba là Chase Lochmiller, người sáng lập Crusoe. Crusoe đã xây dựng một khu vực trung tâm dữ liệu 2.1 GW ở Abilene, một thị trấn nhỏ ở phía tây Texas, đó là trạm điện tư nhân lớn nhất Mỹ, doanh thu tiêu thụ bằng hai thành phố Denver, và các công ty đầu tiên đầu tiên đặt chỗ là Oracle và OpenAI. Khu vực có 9000 công nhân xây dựng quanh năm, trong khi dân số của thị trấn chỉ có 120 nghìn người.
Trong một bảng trình chiếu, Chase phân tích chi phí hàng năm của mỗi MW điện: tổng chi phí khoảng 19 triệu USD, trong đó mục chi lớn nhất là lao động, mỗi MW lên tới 4.7 triệu USD, chi phí chip và thiết bị làm mát nằm phía sau xa. Theo tính toán này, một khu vực GW, chỉ riêng khoản chi phí lao động hàng năm có thể lên tới 4.7 tỷ USD.

Ngoài chi phí lao động, chi phí xây dựng mỗi MW của turbine khí đã tăng từ 1 triệu USD lên 3 triệu USD trong vòng ba năm. Nguyên nhân phía sau là bốn nhà sản xuất lớn GE Vernova, Siemens, Mitsubishi Heavy Industries và Pratt & Whitney đã giữ nguyên công suất sản xuất trong khi nhu cầu đã tăng gấp đôi.

Hãng Chase đã đánh giá thấp các ông lớn trong ngành thiết bị điện như Eaton, Schneider không nhiều thay đổi trong hàng trăm năm qua. Từ quan điểm dài hạn, kiến trúc điện đã phải trải qua quá trình thiết kế lại từ áp suất cao 765 kV đến 900 VDC trong tủ điện, dù trong ngắn hạn, các nhà máy cổ điển này vẫn sẽ tiếp tục hưởng lợi.
Khách mời của bài giảng thứ tư là Giám đốc điều hành của công ty phần mềm Databricks, Ali Ghodsi. Ngay từ đầu, ông đã đưa ra một quan điểm quan trọng: Trí tuệ nhân tạo tổng quát (AGI) đã được đạt. Các mô hình AI hiện nay đã đáp ứng đúng theo định nghĩa AGI mà Berkeley AMP Lab năm 2009 đã đề ra. Trái bóng đã được đưa vào sân, chỉ là mọi người luôn kéo cổ cổ hơn.
Lý do mà mọi người cho rằng AI chưa đạt được mong đợi là do chính bản thân họ.

Một báo cáo của MIT cho thấy 95% doanh nghiệp thất bại trong việc thử nghiệm AI, Ali giải thích rằng mô hình thiếu bối cảnh trong tổ chức mà chưa ai viết ra.
Mỗi công ty đều có một nhân viên cố gắng nhiều năm kinh nghiệm, mọi người đều hỏi ông ta khi gặp khó khăn, nhưng những kiến thức trong đầu ông ta chưa bao giờ được thể hiện trong bất kỳ mô hình nào.
Trong khi đó, động cơ điện đã được phát minh vào năm 1880, nhưng cho đến năm 1920, nó mới bắt đầu cải thiện nhanh chóng về mặt thống kê hiệu suất. Trong bốn mươi năm đó, các doanh nghiệp chỉ chuyển từ động cơ hơi nước sang động cơ điện mà không ai nghĩ rằng toàn bộ bố trí xưởng cần phải bổ sung hoàn toàn.
Databricks cũng đã gặp khó khăn, một bộ kết nối dữ liệu mà ban đầu cần ba quý mới giao được cho AI, lần đầu tiên chuyển cho AI xử lý, chỉ tiết kiệm được một tháng và một nửa thời gian. Sau đó, một người đứng ra dám vứt bỏ toàn bộ quy trình và làm lại, giao được trong một quý. Việc thật sự tiết kiệm thời gian không phải là bản cập nhật mô hình, mà là người vứt bỏ và làm lại toàn bộ quy trình đó.
Ali cho rằng, cơ hội lớn ở tầng ứng dụng sẽ xuất hiện, và sẽ tập trung vào những người chơi dám viết lại hệ thống tổ chức. Tốc độ triển khai của việc này nằm trong tay con người, chứ không phải là GPT-6, Opus-5.
Trong ngăn xếp công nghệ, giá trị tự nhiên sẽ di chuyển từ phần cứng ở tầng dưới lên phần mềm và ứng dụng ở tầng cao hơn.
Ngành công nghiệp điện toán đám mây đã hoàn tất việc chuyển từ sự dẫn dắt bởi phần cứng sang sự dẫn dắt bởi phần mềm, mất đến 15 năm để làm điều đó. Ngăn AI cần hoàn tất sự đảo ngược giá trị tương tự, hoặc thông qua việc ứng dụng tiếp tục phát triển mạnh mẽ, hoặc chờ đợi biên lợi nhuận từ tầng chip giảm từ vị thế cao 73% xuống gần với 6% của phần cứng thời đại đám mây. Hiện tại cả hai phía đều đang xảy ra, nhưng tốc độ chuyển đổi chưa đủ nhanh. Theo tốc độ biến đổi trong hai năm qua, để ứng dụng chinh phục mức chia sẻ lợi nhuận như nền tảng công nghệ đám mây đã từng đạt được, cần ít nhất mười năm để bắt đầu.
Do đó, vào thời điểm hiện tại, đánh cược vào tầng chip có nghĩa là đánh cược vào dòng tiền mặt sẽ tới tay trong hai năm tới; đánh cược vào tầng ứng dụng là nhìn nhận xu hướng tăng giá trị trong vòng năm đến mười năm tới.

Trước khi cuộc cách mạng công nghệ làm sụt giảm biên lợi nhuận từ tầng chip diễn ra, càng gần chip, càng gần lợi nhuận.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia