BTC

$96,000

5.73%

ETH

$3,521.91

3.97%

HTX

$0.{5}2273

5.23%

SOL

$198.17

3.05%

BNB

$710

3.05%

简体中文

繁體中文

English

Tiếng Việt

한국어

日本語

ภาษาไทย

Türkçe

Chúng tôi đã công bố mã nguồn mở của Lighthouse. Chú ý: Việc chạy một nút B200 với dung lượng 512K đã giúp tăng tốc độ lên đến 17 lần.

Theo theo dõi từ BeatByte, Nous Research đã phát hành cơ chế huấn luyện trước bằng ngữ cảnh dài Lighthouse Attention. Khi xử lý văn bản dài 512K trên một card đồ hoạ B200, tốc độ tính toán của phương pháp này nhanh khoảng 17 lần so với cơ chế truyền thống và đạt được tăng tốc huấn luyện end-to-end từ 1.4 đến 1.7 lần ở văn bản dài 98K.

Cơ chế chú ý truyền thống yêu cầu tính toán tất cả các mối quan hệ hai ngữ cảnh với nhau, khi văn bản dài lên, chi phí tính toán tăng một cách bình phương. Lighthouse Attention chuyển sang phương pháp sàng lọc trước rồi tính toán chính xác sau. Ban đầu, nó sẽ khám phá nhanh chóng tóm tắt nén của văn bản ở các cấp độ khác nhau, thông qua việc đánh giá gạch chân để chọn ra các đoạn quan trọng ghép thành văn bản ngắn, sau đó trực tiếp chuyển cho toán tử hiệu quả FlashAttention xử lý. Do logic sàng lọc đã được tách rời hoàn toàn khỏi phần cốt lõi, các nhà phát triển không cần phải mất công viết mã cấp thấp, cũng như không cần tăng thêm mục tiêu huấn luyện.

Trong quá khứ, các giải pháp tăng tốc tương tự thường có tác dụng phụ, khi mô hình quen thuộc với việc đọc nhảy, dễ mất khả năng đọc kỹ từng chữ. Để tránh rơi vào bẫy này, nhóm phát triển đã cho mô hình chạy qua phần lớn tiến trình ở chế độ tăng tốc, chỉ chuyển lại tính toán chú ý toàn cục truyền thống ở cuối quá trình huấn luyện để mô hình có thời gian thích nghi ngắn. Trong bài thử nghiệm với mô hình tỷ lệ 5.3 tỷ tham số, cung cấp 500 tỷ dữ liệu huấn luyện Token, mô hình được huấn luyện theo cách này không chỉ rút ngắn đáng kể thời gian mà kết quả cuối cùng còn đạt hoặc vượt qua phiên bản cơ sở huấn luyện truyền thống toàn bộ.

Liên kết gốc

Báo lỗi/Báo cáo

Bài viết nổi bật

WhatsApp sẽ thêm tính năng "Chế độ Ẩn danh" vào trò trò chuyện AI với Meta

Argentum AI đã ký kết một thỏa thuận trị giá 25 tỷ USD với một công ty dịch vụ điện toán đám mây và một doanh nghiệp bất động sản

微信读书 đã ra mắt Kỹ năng độc quyền, hỗ trợ trực tiếp từ trí tuệ nhân tạo (AI) đến kệ sách cá nhân và ghi chú đọc sách.

Báo lỗi/Báo cáo

Gửi

Thêm mới thư viện

Chỉ mình tôi có thể nhìn thấy

Công khai

Lưu

Chọn thư viện

Thêm mới thư viện

Hủy

Hoàn thành

Chúng tôi đã công bố mã nguồn mở của Lighthouse. Chú ý: Việc chạy một nút B200 với dung lượng 512K đã giúp tăng tốc độ lên đến 17 lần.

Không cần viết code, Hướng dẫn xây dựng AI Agent đầu tiên của bạn trong vòng 2 ngày (Toàn bộ Hướng dẫn)

Ai sẽ quyết định các quy tắc của thời đại Ai? Anthropic thảo luận về cảnh tranh AI giữa Mỹ và Trung Quốc vào năm 2028

「Buddy」 đã gửi 250.000 đồng USDC vào Hyperliquid, tiếp tục tăng vị thế ETH đối với đồng USDC

gammafund.eth đã chuyển 5480 ETH vào Binance, khoảng 11,93 triệu USD

Trước đó mua ETH "Sản Phẩm Thông Minh" với giá trung bình là 3.45 USD, sau 1 năm mua thêm 647.137 ETH.

Loracle.hl đạt lợi nhuận 5 lần từ giao dịch rũ bỏ đã quay trở lại, lợi nhuận tổng cộng tăng lên 41.43 triệu USD