BTC
$96,000
5.73%
ETH
$3,521.91
3.97%
HTX
$0.{5}2273
5.23%
SOL
$198.17
3.05%
BNB
$710
3.05%
lang
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
Trang chủ
Cộng đồng
AI AI
Tin nhanh
Bài viết
Sự kiện
Thêm
Thông tin tài chính
Chuyên đề
Hệ sinh thái chuỗi khối
Mục nhập
Podcast
Data
OPRR

Tại sao Agent của bạn lại ngưng hoạt động sau vài phút chạy? Kỹ sư của OpenAI: Nó cần một bảng điểm và bộ nhớ ngoại vi.

Theo theo giới thiệu từ Telegram Beating, Codex's / mục tiêu tính năng cho phép Đặc Vụ lặp đi lặp lại cho đến khi hoàn thành nhiệm vụ, nhưng điều này đã mở rộng lỗi thẩm định mập mờ của con người. Kỹ sư của OpenAI, Chris Hayduk, dựa trên kinh nghiệm thực tế nội bộ, cho biết chỉ thị mập mờ như "tối ưu mã" sẽ khiến mô hình tự bỏ cuộc sớm vì không biết điểm kết thúc, hoặc mắc kẹt trong vòng lặp sửa đổi mù quáng.

Để Đặc Vụ có thể hoạt động ổn định trong vài ngày thậm chí hơn, anh ấy rút ra ba nguyên tắc sau:
- Loại bỏ từ chất lượng, thay bằng danh sách: Mô hình không thể đánh giá được điều gì là "tốt hơn", nhưng có thể hiểu được "rút ngắn thời gian 20% mà không bị treo khi kiểm thử". Đối mặt với nhiệm vụ có tính định tính như sắp xếp bài báo, anh ấy thậm chí đã đưa một danh sách định dạng chứa 200 yêu cầu cụ thể cho Codex, biến nhiệm vụ trừu tượng thành nhiệm vụ định lượng - "đánh dấu đầy là hoàn thành".
- Nén thời gian xác nhận xuống cấp độ phút: Đặc Vụ cần phải kiểm tra xem hành động có hiệu quả hay không. Đừng để nó chạy trong môi trường sản xuất lớn vài giờ, hãy cung cấp cho nó một tập dữ liệu mẫu và một hệ thống nhẹ, làm cho vòng lặp phản hồi ngắn nhất có thể.
- Xây ba tệp như "não": Ngay cả khi vùng ngữ cảnh lớn đến đâu, sau số ngày chạy vẫn có thể mất trí nhớ. Anh ấy đề xuất trực tiếp tạo ba tệp Markdown: PLAN.md (Kế hoạch toàn cầu), EXPERIMENTS.md (Ghi chép thử nghiệm) và EXPERIMENT_NOTES.md (Bản nháp suy nghĩ thời gian thực), buộc mô hình ghi lại quá trình thử lầm của mình trên ổ cứng.

举报 Báo lỗi/Báo cáo
Báo lỗi/Báo cáo
Gửi
Thêm mới thư viện
Chỉ mình tôi có thể nhìn thấy
Công khai
Lưu
Chọn thư viện
Thêm mới thư viện
Hủy
Hoàn thành