BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

提速4倍且不爆显存，MIT与英伟达发布Lightning OPD：砍掉大模型蒸馏的实时教师服务

Theo giám sát từ Beating AI, NVIDIA và nhóm nghiên cứu MIT đã phát hành một hệ thống huấn luyện mới sau mô hình ngôn ngữ lớn với tên gọi Lightning OPD (Offline Policy Distillation). Công nghệ này thông qua việc tính toán trước các xác suất logarithm của mô hình giáo viên (log-probabilities), đã hoàn toàn loại bỏ việc phải duy trì một dịch vụ giáo viên thời gian thực trực tuyến suốt quá trình huấn luyện truyền thống, từ đó tăng hiệu quả huấn luyện lên gấp 4 lần.

Trước đó, phương pháp truyền nguyên tắc chuẩn (OPD) đòi hỏi máy chủng vận hành mô hình học trò và giáo viên đồng thời trên một máy. Khi kích thước mô hình tăng lên, cách tiếp cận này thường gặp sự cố tràn bộ nhớ (OOM). Lightning OPD đã giải phóng toàn bộ sức mạnh tính toán GPU cho mô hình học trò. Trong quá trình thử nghiệm trên 8 card đồ hoạ H100 trên một nút, Lightning OPD đã thành công huấn luyện mô hình giảng viên cho mô hình MoE lớn Qwen3-30B-A3B-Base (tổng cộng 300 tỷ tham số), đạt điểm số 71.0 trên bài kiểm tra AIME 2024; so với đó, OPD chuẩn trực tiếp gặp sự cố tràn bộ nhớ trên cùng cấu hình phần cứng. Trên quy mô nhỏ hơn với Qwen3-8B, hệ thống chỉ mất 30 giờ tính toán trên 30 card GPU để đạt điểm 69.9.

Trong bài báo, nhóm nghiên cứu đã chỉ ra một tiền đề ẩn của việc thực hiện truyền nguyên tắc ngoại tuyến: "Nhất quán giữa giáo viên và học trò". Mô hình học trò phải sử dụng cùng một mô hình giáo viên trong quá trình điều chỉnh giám sát (SFT) và giai đoạn truyền nguyên tắc tiếp theo. Nếu không tuân thủ nguyên tắc này, hướng dẫn sẽ bị lệch, dẫn đến hiệu suất của mô hình sụp đổ cuối cùng.

Liên kết gốc

Báo lỗi/Báo cáo

Bài viết nổi bật

Michael Saylor: Đạo Luật Clarity sẽ Mở Ra làn sóng vốn số hóa toàn cầu tiếp theo

Bakkt Q1 Doanh thu suy giảm 77%, chuyển hướng sang Dịch vụ Hạ tầng Đồng coin ổn định

Ngân hàng Châu Á Thái Bình Dương: Đưa mục tiêu giá của NVIDIA lên từ 265 USD lên 315 USD.

Báo lỗi/Báo cáo

Gửi

Thêm mới thư viện

Chỉ mình tôi có thể nhìn thấy

Công khai

Lưu

Chọn thư viện

Thêm mới thư viện

Hủy

Hoàn thành

提速4倍且不爆显存，MIT与英伟达发布Lightning OPD：砍掉大模型蒸馏的实时教师服务

CRCL tăng mạnh, Báo cáo tài chính của Circle tiết lộ hai vũ khí chính

Arthur Hayes bài viết mới nhất: Bubble về Trí Tuệ Nhân Tạo chính là Cơ Hội Lớn Nhất

Khái niệm "VVV" tăng 9 lần sau 6 tháng, là Đường chân trời AI mới của Hệ sinh thái Base

Mô hình AI ngày càng rẻ, tại sao "VVV" lại trở nên đắt giá hơn?

Một địa chỉ mới đã rút 331 BTC từ Binance, tương đương khoảng 26.7 triệu USD

Một con cá voi đã chuyển 5819.8 ETH vào OKX, đồng thời mắc lỗ thêm 26.3 nghìn USD

「Người cắt giảm vị thế ngắn ZEC」 Giảm vị thế ngắn ZEC, giải ngân vốn với quy mô 17 triệu USD để bán khống BTC và ETH

Hyperliquid trên người chơi dài hạn số 1 theo sắp xếp bạc, rời khỏi vị thế, ghi lời lãi 10,400,000 USD từ kho dài hạn