Theo theo dõi của Beating, tiến sĩ nghiên cứu trước đây tại Anthropic và hiện là nhà nghiên cứu tại Google DeepMind, Yao Shunyu, đã tiết lộ quy trình nội bộ của Claude 3.7 trong podcast "Ngôn ngữ là thế giới". Anh gia nhập Anthropic vào tháng 10 năm 2024 và được gắn vào một nhóm được gọi là Horizon, lúc đó toàn bộ nhóm chỉ có 10 đến 11 người, bao gồm mọi khía cạnh của học tăng cường. Claude 3.7 mất từ bốn đến năm tháng từ quá trình nghiên cứu đến việc phát hành cuối cùng, hai ba tháng đầu tiên được dành cho nghiên cứu thuật toán và dữ liệu, hai tháng sau được dành cho huấn luyện và xây dựng cơ sở hạ tầng.
Anthropic không đặt cược vào khả năng code từ đầu. Yao Shunyu tiết lộ rằng lý do mà Claude 3 mạnh hơn việc viết mã so với GPT-4 là vì một lý do kỹ thuật mà anh không thể tiết lộ, là một team tự phát triển từ dưới lên. Phản hồi tích cực trên Twitter sau khi Claude 3 được phát hành đã xác minh ưu điểm này, sau đó ban lãnh đạo Anthropic đã nâng cấp khả năng code thành một chiến lược cấp công ty. Anh cho rằng khả năng đầu tư nhanh chóng của Anthropic như vậy bắt nguồn từ chỗ Jared Kaplan và Sam McCandlish, giám đốc cấp công ty, đồng thời là cộng sáng lập viên, mà ở mặt kỹ thuật, họ không chỉ phục vụ mọi người mà còn có quyền quyết định, trong khi OpenAI không thể làm điều này, Ilya có thể khi còn ở đó, nhưng sau đó mất quyền ra đi. Vào thời điểm đó, Anthropic về mặt sản phẩm gần như không có ý thức gì cả, trong nửa năm, Claude 3.5 đã phát hành hai phiên bản nhưng vẫn sử dụng cùng một tên, cuối cùng chỉ có thể phân biệt được bằng biệt hiệu ngoài cửa "3.6".
Lưu ý: Có hai nhà nghiên cứu trong lĩnh vực AI có cùng phát âm dễ dẫn đến nhầm lẫn. Người được phỏng vấn trong bài viết là Yao Shunyu, tốt nghiệp khoa Vật lý Đại học Tsinghua, tiến sĩ lý thuyết vật lý của Đại học Stanford, gia nhập Anthropic vào năm 2024 để tham gia nghiên cứu học tăng cường Claude 3.7 và Claude 4, chuyển công việc sang Google DeepMind vào tháng 9 năm 2025. Người kia là Yao Shunyu, tốt nghiệp khoa Tin học trường Yao của Đại học Tsinghua, tiến sĩ máy tính của Đại học Princeton, đề xuất khuôn khổ Tree of Thoughts và ReAct, từng là nghiên cứu viên tại OpenAI, vào tháng 12 năm 2025 được bổ nhiệm làm nhà khoa học trưởng trí tuệ nhân tạo của Tencent. Cả hai là bạn cùng khoa tại trường Đại học Tsinghua.
