Theo dõi từ Động Sát Beating, người đứng đầu bộ phận AI của Microsoft (Microsoft AI, viết tắt MAI), Mustafa Suleyman, đã công bố tại Hội nghị nhà phát triển Build 2026 về việc ra mắt dòng mô hình MAI gốc do chính họ phát triển. Dòng sản phẩm này bao gồm tổng cộng 7 mô hình, bao phủ các lĩnh vực như suy luận, lập trình, hình ảnh, chuyển đổi văn bản và giọng nói, tất cả đều được Microsoft huấn luyện từ đầu, không sử dụng bất kỳ mô hình bên thứ ba nào để chưng cất tri thức, và tất cả các tập dữ liệu đều đã được cấp phép hợp quy. Microsoft cho biết sẽ cam kết xây dựng "Siêu trí tuệ nhân văn (Humanist Superintelligence)", đảm bảo AI tiên tiến đóng vai trò là công cụ hỗ trợ cho con người và chịu sự giám sát của con người. Đồng thời, cụm tính toán GB200 đã được Microsoft đưa vào vận hành toàn diện để thúc đẩy sự phát triển liên tục của hệ sinh thái mô hình này.
Mô hình suy luận hàng đầu của dòng MAI, MAI-Thinking-1, có 35 tỷ tham số hoạt động, sử dụng kiến trúc hỗn hợp chuyên gia (MoE) và cung cấp cửa sổ ngữ cảnh 128K. Trong các đánh giá về kỹ thuật phần mềm và suy luận toán học chính thống như SWE-bench Pro, mô hình này đạt trình độ tương đương với Claude Opus 4.6 và vượt trội hơn Claude Sonnet 4.6 trong các đánh giá mù của con người. Hướng đến các tình huống lập trình, MAI đã ra mắt mô hình lập trình tác nhân MAI-Code-1-Flash với 5 tỷ tham số, mô hình này sẽ được tích hợp sâu vào GitHub Copilot và VS Code, cung cấp hiệu suất tương đương Claude Haiku với chi phí suy luận thấp hơn. Về đa phương thức, MAI-Image-2.5 và biến thể Flash của nó hỗ trợ tạo hình ảnh từ văn bản và chỉnh sửa hình ảnh với độ chính xác cao, điểm chất lượng hình ảnh vượt qua Nano Banana Pro; về giọng nói và chuyển đổi văn bản, đã ra mắt mô hình chuyển đổi văn bản 43 ngôn ngữ MAI-Transcribe-1.5 với độ chính xác SOTA và tốc độ nhanh hơn 5 lần so với đối thủ, cùng mô hình tạo giọng nói MAI-Voice-2 và biến thể Flash của nó hỗ trợ 15 ngôn ngữ, có khả năng kiểm soát cảm xúc và nhân bản zero-shot. Các mô hình trên không chỉ được triển khai trên Azure AI Foundry mà còn có mặt trên OpenRouter, Fireworks và Baseten, và lần đầu tiên cho phép các nhà phát triển tự tinh chỉnh trọng số. Microsoft cũng tiết lộ rằng, thông qua việc tối ưu hóa phần cứng và phần mềm kết hợp giữa mô hình và chip tự phát triển Maia 200, hiệu suất tính toán đã được cải thiện 1,4 lần.
Ngoài việc phát hành các mô hình cơ bản, Microsoft đã ra mắt dịch vụ "Tinh chỉnh tiên phong (Frontier Tuning)" dựa trên môi trường học tăng cường (RLE). Dịch vụ này cho phép doanh nghiệp sử dụng các quỹ đạo hoạt động nội bộ, chuỗi quyết định và dữ liệu chuyên ngành của mình để huấn luyện tùy chỉnh các mô hình MAI trong một môi trường cách ly hoàn toàn được kiểm soát ("phòng tập huấn luyện"). Các thử nghiệm cho thấy, các mô hình tùy chỉnh sau Frontier Tuning có hiệu suất được cải thiện đáng kể, trong đó mô hình MAI được tối ưu hóa cho Excel có hiệu suất ngang bằng với GPT-5.4 nhưng hiệu quả cao hơn 10 lần; mô hình MAI tùy chỉnh cho McKinsey đạt tỷ lệ thắng cao nhất đồng thời giảm chi phí gần 10 lần. Ngoài ra, Microsoft đã công bố hợp tác chiến lược với tổ chức y tế hàng đầu thế giới Mayo Clinic, cùng phát triển mô hình lớn về suy luận lâm sàng dựa trên dữ liệu lâm sàng của Mayo và nền tảng AI của Microsoft. Mô hình này thuộc quyền sở hữu của Mayo Clinic, sẽ được triển khai đầu tiên nội bộ tại Mayo để chẩn đoán sớm và thiết kế phương án điều trị, sau đó sẽ được mở cho các tổ chức y tế khác thông qua Azure AI Foundry.
