TL;DR
· Anthropic bị phát hiện đang khám phá việc tự phát triển chip máy chủ AI, nhưng chưa xác nhận thiết kế, chạy thử hay kế hoạch sản xuất hàng loạt.
· OpenAI đã tiết lộ chip suy luận Jalapeño và bắt đầu thử nghiệm, dự kiến triển khai trước cuối năm 2026.
· Samsung có thể hưởng lợi từ xu hướng gia công chip AI, nhưng Anthropic vẫn phụ thuộc vào sức mạnh tính toán của AWS, Google và Nvidia trong ngắn hạn.
Các cuộc thảo luận xung quanh việc Anthropic tự phát triển chip máy chủ AI đang nóng lên, nhưng đây chưa phải là một dây chuyền sản xuất chip đã được triển khai. Trọng tâm bên ngoài quan tâm là chi phí suy luận đằng sau Claude, nguồn cung GPU, điện năng trung tâm dữ liệu và dung lượng giá đỡ đang trở thành những ràng buộc cứng đối với các công ty mô hình lớn. OpenAI đã tiết lộ chip suy luận Jalapeño hợp tác với Broadcom, và Anthropic cũng bị phát hiện đang đánh giá các chip chuyên dụng phù hợp hơn với mô hình của riêng mình. Tuy nhiên, từ thông tin công khai hiện tại, việc Samsung có tham gia sản xuất hay không, và liệu dự án có bước vào thiết kế chính thức hay không, vẫn chưa được xác nhận.
Hướng đi mà Anthropic bị phát hiện đang khám phá là một chip máy chủ phù hợp hơn với cách vận hành mô hình AI của riêng họ. So với GPU đa năng, nếu chip tùy chỉnh được thiết kế thành công, nó có thể giảm chi phí, tăng hiệu suất năng lượng trong các tác vụ suy luận cụ thể, và giảm sự phụ thuộc vào nguồn cung chip bên ngoài.
Khó khăn của loại chip này không chỉ nằm ở hiệu suất của một chip đơn lẻ. Các công ty mô hình lớn cần đồng thời xử lý tốc độ tính toán, băng thông bộ nhớ, mạng kết nối, mức tiêu thụ điện năng, tản nhiệt và độ ổn định của cụm máy. Điều thực sự khó khăn là làm cho hàng nghìn con chip phối hợp ổn định trong trung tâm dữ liệu và liên tục phục vụ các tác vụ huấn luyện hoặc suy luận.
Hiện tại, cách diễn đạt thận trọng hơn là Anthropic vẫn đang trong giai đoạn đánh giá và xác định ban đầu. Chip sẽ đảm nhận chủ yếu các tác vụ AI nào, mục tiêu hiệu suất và mức tiêu thụ điện năng được thiết lập ra sao, cách thích ứng ở cấp độ máy chủ và cụm máy, liệu có cần sự tham gia của các công ty thiết kế chip bên ngoài hay không – tất cả những câu hỏi này vẫn chưa có câu trả lời công khai rõ ràng.
Thông điệp chính thức của công ty cũng giữ thái độ thận trọng. Anthropic hồi tháng 4 năm nay đã công bố mở rộng hợp tác với Amazon, đầu tư hơn 100 tỷ USD vào công nghệ AWS trong thập kỷ tới, khóa tối đa dung lượng 5GW, và cho biết đã sử dụng hơn 1 triệu chip Trainium2 để huấn luyện và phục vụ Claude. Anthropic đồng thời nhấn mạnh chiến lược phần cứng đa dạng, nhưng AWS vẫn là nhà cung cấp dịch vụ đám mây và huấn luyện chính của họ.
Điều này có nghĩa là, ngay cả khi việc khám phá tự phát triển chip tiếp tục được đẩy mạnh, trong ngắn hạn nó khó có thể thay thế các nhà cung cấp hiện tại. AWS Trainium, Google TPU và GPU Nvidia vẫn là những thành phần quan trọng trong hệ thống sức mạnh tính toán quy mô lớn của Anthropic.
Anthropic lúc này được đưa vào cuộc thảo luận về chip tự phát triển, một bối cảnh quan trọng là OpenAI đã đưa ra tham chiếu trước đó.
Thông báo chính thức từ Broadcom cho thấy, OpenAI và Broadcom đã phát hành Jalapeño vào ngày 24 tháng 6 năm 2026, được định vị là bộ tăng tốc cho suy luận mô hình ngôn ngữ lớn, còn được gọi là Bộ xử lý thông minh. OpenAI và Broadcom cho biết, con chip này mất khoảng 9 tháng từ thiết kế ban đầu đến sản xuất và chạy thử, mẫu kỹ thuật đã hoạt động trong phòng thí nghiệm và dự kiến bắt đầu triển khai vào cuối năm 2026.
Cần phân biệt hai giai đoạn ở đây. Jalapeño đã được phát hành và đưa vào thử nghiệm, nhưng không có nghĩa là nó đã được thương mại hóa quy mô lớn. Nó đại diện cho việc các công ty mô hình hàng đầu bắt đầu đưa chi phí suy luận vào tầm kiểm soát phần cứng sâu hơn, chứ không phải nhu cầu GPU sẽ ngay lập tức bị thay thế.
Suy luận là quá trình tính toán mà mô hình tạo ra câu trả lời sau khi người dùng đặt câu hỏi cho các sản phẩm như ChatGPT, Claude. So với huấn luyện, suy luận xảy ra thường xuyên hơn, và khi quy mô người dùng mở rộng, áp lực chi phí sẽ tiếp tục tăng. Đối với các công ty mô hình lớn, ngay cả khi chi phí suy luận đơn lẻ chỉ giảm một tỷ lệ rất nhỏ, khi áp dụng vào hàng loạt yêu cầu và chi tiêu trung tâm dữ liệu dài hạn, nó cũng có thể trở thành khoản tiết kiệm đáng kể.
Nhịp độ của Anthropic rõ ràng là sớm hơn. Họ chưa công bố thông số kỹ thuật chip, cũng chưa tiết lộ chỉ số hiệu suất, danh sách đối tác hoặc lịch trình sản xuất hàng loạt. Tiến triển của OpenAI chỉ cho thị trường thấy một hướng đi: các công ty mô hình hàng đầu không chỉ mua GPU, mà còn đang cố gắng đưa một phần cơ sở hạ tầng tính toán vào tầm kiểm soát của riêng mình.
Samsung được thị trường chú ý vì họ vừa có năng lực sản xuất tiên tiến, vừa đang tìm kiếm thêm cơ hội gia công chip AI. Sau khi xuất hiện tin tức về việc huy động vốn và hợp tác cơ sở hạ tầng của Anthropic, bên ngoài tự nhiên liên kết Samsung với cơ hội sản xuất bộ tăng tốc AI tiềm năng.
Nhưng điều này cần được nhìn nhận một cách thận trọng. Thông tin công khai có thể xác nhận rằng các công ty như Samsung, SK Hynix, Micron đã từng xuất hiện trong các cuộc thảo luận về đối tác cơ sở hạ tầng của Anthropic. Micron đã tuyên bố vào ngày 22 tháng 6 năm 2026 rằng họ đã đạt được thỏa thuận chiến lược với Anthropic, bao gồm thiết kế kiến trúc AI bộ nhớ và lưu trữ, thỏa thuận cung ứng, việc Micron nội bộ áp dụng Claude, và đầu tư chiến lược vào Series H của Anthropic.
Những tín hiệu hợp tác này không thể trực tiếp suy ra rằng Samsung đã nhận được đơn đặt hàng chip tự phát triển của Anthropic. Thông tin công khai có thể kiểm chứng về việc Anthropic đã tiếp xúc với Samsung để hợp tác sản xuất vẫn chưa đầy đủ. Một nhận định thận trọng hơn là: nếu dự án chip tự phát triển của Anthropic tiến đến giai đoạn sản xuất, Samsung có thể trở thành một trong những ứng viên tiềm năng được thị trường chú ý, nhưng hiện tại chưa thể coi đây là một thỏa thuận chắc chắn.
Đối với các dự án chip, từ đánh giá ban đầu đến sản xuất hàng loạt cuối cùng, vẫn còn nhiều bước như xác định kiến trúc, xác minh thiết kế, lựa chọn quy trình sản xuất, đóng gói, kiểm thử và điều phối chuỗi cung ứng. Chừng nào thiết kế chip chưa được định hình, vai trò đối tác gia công cũng khó có thể thực sự được xác nhận.
Các động thái nhân sự khiến manh mối phần cứng của Anthropic được chú ý hơn. Theo báo cáo, Clive Chan, thành viên ban đầu của đội ngũ chip tùy chỉnh OpenAI, đã gia nhập Anthropic. Hồ sơ công khai cho thấy anh từng tham gia xây dựng đội ngũ chip của OpenAI và có kinh nghiệm liên quan đến Tesla Dojo. Gần đây, Anthropic cũng đang tăng cường tuyển dụng kỹ sư chip.
Điều này cho thấy công ty ít nhất đang chuẩn bị cho năng lực phần cứng. Đối với một công ty mô hình, một đội ngũ phần cứng hiểu về mô hình, tải suy luận và hệ thống trung tâm dữ liệu có thể giúp họ đánh giá những công việc nào phù hợp với chip tùy chỉnh và những công việc nào vẫn nên dựa vào GPU, TPU hoặc chip của nhà cung cấp đám mây.
Nhưng việc gia nhập nhân tài và mở rộng tuyển dụng vẫn chỉ là tín hiệu đầu tư ban đầu. Dự án có thể tiếp tục hay không phụ thuộc vào việc chip có đạt được lợi thế đủ lớn về chi phí, hiệu suất, năng lượng và độ phức tạp triển khai hay không. Nếu chip tùy chỉnh chỉ cải thiện hiệu quả trên lý thuyết nhưng không thể vận hành ổn định ở quy mô lớn, hoặc chi phí sản xuất và thích ứng phần mềm quá cao, công ty vẫn có thể tiếp tục chủ yếu dựa vào chip bên ngoài.
Đây cũng là lý do tại sao NVIDIA khó bị thay thế trong ngắn hạn. GPU của NVIDIA vẫn là lực lượng chính cho huấn luyện và suy luận AI, hệ sinh thái phần mềm đã trưởng thành, và các khách hàng trung tâm dữ liệu đã xây dựng nhiều hệ thống xung quanh nền tảng của họ. Chip tự phát triển có nhiều khả năng sẽ chia sẻ một phần công việc trong các kịch bản suy luận cụ thể, thay vì thay thế hoàn toàn GPU.
Đối với nhà đầu tư, tác động thực tế của cuộc thảo luận về chip tự phát triển của Anthropic, trong ngắn hạn, giống như một cuộc chơi trong chuỗi cung ứng hơn. Các công ty mô hình hàng đầu muốn có nhiều quyền lựa chọn sức mạnh tính toán hơn, và các nhà cung cấp đám mây, Broadcom, Samsung, TSMC, nhà sản xuất bộ nhớ và chuỗi cung ứng đóng gói tiên tiến đều có thể hưởng lợi từ xu hướng này. Nhưng trong trường hợp của Anthropic, các sự kiện rõ ràng vẫn còn hạn chế: nghiên cứu tự phát triển vẫn ở giai đoạn đầu, vai trò của Samsung chưa được xác nhận, và sức mạnh tính toán quy mô lớn của Claude vẫn không thể thiếu AWS, Google và NVIDIA.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia