BTC
$96,000
5.73%
ETH
$3,521.91
3.97%
HTX
$0.{5}2273
5.23%
SOL
$198.17
3.05%
BNB
$710
3.05%
lang
简体中文
繁體中文
English
Tiếng Việt
한국어
日本語
ภาษาไทย
Türkçe
Trang chủ
Cộng đồng
AI AI
Tin nhanh
Bài viết
Sự kiện
Thêm
Thông tin tài chính
Chuyên đề
Hệ sinh thái chuỗi khối
Mục nhập
Podcast
Data
OPRR

Sách Hướng Dẫn Arbitrage trong Polymarket: Sự Khác Biệt Thực Sự Nằm ở Cơ Sở Hạ Tầng Toán Học

Đọc bài viết này mất 46 phút
Đào giám không phải là mô hình giao dịch "Tôi ở đây, tôi cũng được" mà bài viết này trình bày chi tiết về cách hiểu và phát triển hệ thống đào giám cá nhân một cách có hệ thống.
原文標題:The Math Needed for Trading on Polymarket(完整路線圖)
原文作者:Roan,加密分析師
翻譯、註解:MrRyanChi,insiders.bot


在創立 @insidersdotbot 的過程中,我跟不少高頻做市團隊和套利團隊深有過深度的交流,其中,最大的一個需求,就是怎麼做套利策略。


我們的用戶,朋友,合作夥伴,都在探索著 Polymarket 套利這一條複雜且多維度的交易路線。如果你是一個推特的活躍用戶,那麼我相信你也曾經刷到過「我通過 XX 套利策略,從預測市場上賺了多少錢」這樣的推文。


然而,大部分文章都過度簡化了套利的底層邏輯,讓套利變成了「我上我也行」,「用 Clawdbot 就能解決」的交易模式,而並沒有去詳細解釋怎樣系統性地去理解並開發屬於自己的套利系統。


如果你想理解 Polymarket 上的套利工具是怎麼賺到錢,這篇文章,是我目前看到的最完整的解讀。


由於英文原文有很多過於技術性,需要進行進一步研究的部分,我幫大家進行了重構和補充,方便大家只需要這一篇文章,不需要停下來查資料,就可以理解全部重點內容。


Polymarket 套利並不是簡單的數學問題


你在 Polymarket 上看到一個市場:


YES 價格 $0.62,NO 價格 $0.33。


你心想:0.62 + 0.33 = 0.95,不到 1 塊錢,有套利空間!同時買 YES 和 NO,花 $0.95,無論結果如何都能拿回 $1.00,淨賺 $0.05。


你是對的。


但問題是——當你還在手動算這道加法題的時候,量化系統已經在做一件完全不同的事。


它們在同時掃描 17,218 個條件,跨越 2^63 種可能的結果組合,在毫秒級別內找到所有定價矛盾。等你下完兩筆訂單,價差已經消失了。系統早就在幾十個相關市場裡找到了同樣的漏洞,算好了考慮訂單簿深度和手續費之後的最優倉位大小,並行執行了所有交易,然後把資金轉向了下一個機會。[1]


Sự chênh lệ không chỉ là về tốc độ. Đó là về cơ sở toán học.


Chương 1: Tại sao "Phép cộng" không đủ - Vấn đề Đa Diện Biên


Sai Lầm Của Thị Trường Đơn Một


Hãy xem một ví dụ đơn giản.


Thị trường A: "Trump có thắng tại bang Pennsylvania trong cuộc bầu cử không?"


YES giá $0.48, NO giá $0.52. Tổng cộng chính xác là $1.00.


Trông hoàn hảo, không có không gian arbitrager, phải không?


Sai.


Thêm một thị trường, vấn đề bắt đầu xuất hiện


Xem thị trường B: "Đảng Cộng hòa có vượt mặt đối thủ tại bang Pennsylvania hơn 5 điểm phần trăm không?"


YES giá $0.32, NO giá $0.68. Tổng cộng cũng là $1.00.


Mỗi thị trường riêng lẻ đều "bình thường". Nhưng đây là một mối quan hệ logic:


Cuộc bầu cử tổng thống Mỹ không phải là toàn quốc bỏ phiếu cùng một lúc, mà là theo bang. Mỗi bang là một "chiến trường" độc lập, người nào có thêm phiếu ở bang đó, người đó sẽ giành hết số phiếu đại cử tri của bang đó (người thắng giành hết). Trump là ứng cử viên Đảng Cộng hòa. Vì vậy, "Đảng Cộng hòa thắng tại Pennsylvania" và "Trump thắng tại Pennsylvania" - là một việc. Nếu Đảng Cộng hòa vượt mặt đối thủ hơn 5 điểm phần trăm, điều đó không chỉ có nghĩa là Trump thắng tại Pennsylvania, mà còn thắng rất lớn.


Nói cách khác, YES của thị trường B (Đảng Cộng hòa thắng lớn) là một phần của YES của thị trường A (Trump thắng) - thắng lớn chắc chắn có nghĩa là thắng, nhưng thắng không nhất thiết có nghĩa là thắng lớn.


Và mối quan hệ logic này tạo ra cơ hội arbitrager.


Đó giống như bạn đang đặt cược hai điều - "Ngày mai có mưa không" và "Ngày mai có bão không".


Nếu có bão, chắc chắn sẽ có mưa (bão là một phần của mưa). Vì vậy, giá của "Bão YES" không thể cao hơn giá của "Mưa YES". Nếu giá định giá thị trường vi phạm mối quan hệ logic này, bạn có thể đồng thời mua giá thấp và bán giá cao, kiếm được "lợi nhuận không rủi ro", đó chính là arbitrager.


Sự Phổ Biến của Số Mũ: Tại sao Tìm Kiếm Brute Force Không Thể Hiện


Đối với bất kỳ thị trường nào có n điều kiện, lý thuyết cho biết có 2^n khả năng kết hợp giá.


Nghe có vẻ ổn đấy chứ? Hãy xem một trường hợp thực tế.


Thị trường Giải bóng rổ Đại học NCAA năm 2010 [2]: 63 trận đấu, mỗi trận có 2 kết quả win/loss. Số kết quả kết hợp có thể là 2^63 = 9,223,372,036,854,775,808—hơn 9 tỷ tỷ. Thị trường có hơn 5000 cửa cược.


Số 2^63 này lớn đến đâu? Nếu bạn kiểm tra mỗi giây 10 tỷ kết hợp, bạn sẽ cần khoảng 292 năm để kiểm tra tất cả. Đó là lí do tại sao "Tìm Kiếm Brute Force" hoàn toàn không thể áp dụng ở đây.


Đi kiểm tra từng kết hợp? Về mặt tính toán hoàn toàn không thể.


Tiếp tục với cuộc bầu cử tổng thống Mỹ 2024. Một nhóm nghiên cứu đã tìm thấy 1,576 cặp thị trường có khả năng phụ thuộc vào nhau. Nếu mỗi cặp thị trường có 10 điều kiện, thì mỗi cặp cần kiểm tra 2^20 = 1,048,576 kết hợp. Nhân lên 1,576 cặp. Laptop của bạn đã tính xong, kết quả bầu cử đã được công bố từ lâu rồi.


Quy Hoạch Số Nguyên: Sử Dụng Ràng Buộc Thay Vì Liệt Kê


Giải pháp cho hệ thống định lượng không phải là "liệt kê nhanh hơn", mà là không liệt kê chút nào.


Chúng sử dụng Quy Hoạch Số Nguyên (Integer Programming) để mô tả "các kết quả nào là hợp lệ".


Xem xét một ví dụ thực tế. Thị trường trận đấu giữa Duke và Cornell: Mỗi đội có 7 cửa cược (từ 0 đến 6 trận thắng), tổng cộng 14 điều kiện, 2^14 = 16,384 khả năng kết hợp.


Nhưng có một ràng buộc: họ không thể cùng thắng trên 5 trận, vì họ sẽ gặp nhau ở bán kết (chỉ có một đội được lên hạng).


Quy hoạch số nguyên xử lý như thế nào? Chỉ cần ba ràng buộc:


· Ràng buộc một: Trong 7 cửa cược của Duke, có đúng một cửa đúng (Duke chỉ có thể có một số trận thắng cuối cùng).


· Ràng buộc thứ hai: Trong 7 vòng đấu của Cornell, đúng một vòng đấu.


· Ràng buộc thứ ba: Duke thắng 5 trận + Duke thắng 6 trận + Cornell thắng 5 trận + Cornell thắng 6 trận ≤ 1 (họ không thể cùng thắng nhiều trận).


Ba ràng buộc tuyến tính, thay thế cho 16,384 lần kiểm tra mạnh mẽ.


Tìm kiếm mạnh mẽ so với Quy hoạch số nguyên


Nói cách khác, tìm kiếm mạnh mẽ giống như việc đọc từng từ trong từ điển để tìm một từ. Quy hoạch số nguyên giống như trực tiếp mở đến trang bắt đầu bằng chữ cái đó. Bạn không cần kiểm tra tất cả các khả năng, bạn chỉ cần mô tả "câu trả lời hợp lệ như thế nào" và sau đó để thuật toán tìm kiếm các giá trị vi phạm quy tắc.


Dữ liệu thực tế: 41% thị trường có thể khai thác [2]


Trong văn bản gốc được đề cập, nhóm nghiên cứu đã phân tích dữ liệu từ tháng 4 năm 2024 đến tháng 4 năm 2025:


• Kiểm tra 17,218 điều kiện


• Trong số đó, 7,051 điều kiện thị trường duy nhất có thể khai thác (chiếm 41%)


• Sai lệch giá trị trung vị: $0.60 (nên là $1.00)


• 13 cặp có thể khai thác giữa các thị trường được xác nhận


Sai lệch giá trị trung vị $0.60 có nghĩa là thị trường thường sai lệch 40%. Điều này không phải là "gần như hiệu quả", mà là "có thể khai thác ở quy mô lớn".


Chương 2: Chiếu Bregman — Cách tính giao dịch khai thác tối ưu


Tìm ra cơ hội khai thác là một vấn đề. Tính toán giao dịch khai thác tối ưu là một vấn đề khác.


Bạn không thể đơn giản là "lấy giá trung bình" hoặc "điều chỉnh giá một chút". Bạn cần chiếu trạng thái thị trường hiện tại vào không gian hợp lệ không có khai thác, đồng thời giữ nguyên cấu trúc thông tin trong giá cả.


Tại sao "khoảng cách tuyến tính" không hoạt động



Trong thuật ngữ toán học, đó là việc tối thiểu hóa khoảng cách Euclid: ||μ - θ||²


Nhưng điều này có một vấn đề chết người: nó xem mọi biến động giá như nhau.


Từ $0.50 lên $0.60 và từ $0.05 lên $0.15 đều tăng 10 cent. Nhưng hàm ý thông tin của chúng hoàn toàn khác nhau.


Tại sao? Vì giá thể hiện xác suất ngầm định. Từ 50% lên 60%, là một điều chỉnh quan điểm nhẹ nhàng. Từ 5% lên 15%, là một sự đảo lộn niềm tin lớn - một sự kiện gần như không thể xảy ra đột ngột trở thành "khả thi một chút".


Hãy tưởng tượng bạn đo cân nặng. Từ 70 kg lên 80 kg, bạn có thể nói "đã béo một chút". Nhưng từ 30 kg lên 40 kg (nếu bạn là người lớn), đó là "từ trạng thái gần chết chuyển sang tình trạng suy dinh dưỡng nghiêm trọng". Cùng mức tăng 10 kg, ý nghĩa khác biệt hoàn toàn. Giá cũng vậy - càng gần 0 hoặc 1, biến động giá càng chứa nhiều thông tin.


Bregman Divergence: Đúng "Khoảng cách"


Trái với LMSR mà người làm thị trường của Polymarket sử dụng, giá cược về cơ bản đại diện cho phân phối xác suất.


Trong cấu trúc này, đo lường khoảng cách đúng không phải là khoảng cách Euclid mà là Bregman Divergence.


Đối với LMSR, Bregman Divergence trở thành KL Divergence (Kullback-Leibler Divergence) - một chỉ số đo lường "khoảng cách thông tin" giữa hai phân phối xác suất.


Bạn không cần nhớ công thức. Bạn chỉ cần hiểu một điều:


KL Divergence tự động trọng số cao hơn cho "biến đổi giá gần cực độ". Sự biến đổi từ $0.05 lên $0.15, theo KL Divergence, xa hơn so với sự biến đổi từ $0.50 lên $0.60. Điều này chính xác phản ánh trực giác của chúng ta - biến động giá gần cực độ có ý nghĩa thông tin lớn hơn.


Một ví dụ tốt, là lần cuối cùng trong thị trường dự đoán của @zachxbt, khi Axiom đã vượt mặt Meteora trong những giây cuối cùng, cũng dựa trên biến động giá cực độ, như mọi thay đổi khác.


Bregman Projection vs Euclidean Projection


Arbitrage Profit = Distance of Bregman Projection


This is one of the key conclusions the original author referenced throughout the paper:


The maximum guaranteed profit that any trade can achieve is equal to the Bregman projection distance from the current market state to the arbitrage-free space.


In other words, the further the market price deviates from the "valid space," the more money can be made. And the Bregman projection will tell you:


1. What to trade (the projection direction tells you the trading direction)


2. How much to trade (considering order book depth)


3. How much can be earned (the projection distance is the maximum profit)


The top-ranked arbitrageur earned $2,009,631.76 in a year. [2] His strategy is to solve this optimization problem faster and more accurately than anyone else.


Marginal Polytope and Arbitrage


For example, imagine you are standing on top of a mountain, and at the foot of the mountain, there is a river (arbitrage-free space). Your current position (current market price) is a certain distance from the river.


The Bregman projection helps you find the "shortest path from your position to the riverbank" — but not the straight-line distance, rather the shortest path considering the terrain (market structure). The length of this path is the maximum profit you can earn.


Chapter 3: Frank-Wolfe Algorithm — Turning Theory into Executable Code


Now that you know: to calculate the optimal arbitrage, you need to perform a Bregman projection.


But the problem is — directly computing the Bregman projection is infeasible.


Why? Because the arbitrage-free space (marginal polytope M) has an exponentially large number of vertices. Standard convex optimization methods require accessing the entire constraint set, meaning enumerating every valid result. As mentioned earlier, this is impossible in a large-scale scenario.


Ý tưởng cốt lõi của Frank-Wolfe


Thuật toán Frank-Wolfe [7] có điểm độc đáo ở chỗ: Nó không cố gắng giải quyết toàn bộ vấn đề một lượt, mà thay vào đó từng bước tiến dần đến câu trả lời.


Cách thức hoạt động như sau:


Bước 1: Bắt đầu từ một tập hợp kết quả hợp lệ nhỏ đã biết.


Bước 2: Tối ưu trên tập hợp nhỏ này, tìm ra giải pháp tốt nhất hiện tại.


Bước 3: Sử dụng lập trình số nguyên để tìm ra một kết quả hợp lệ mới, thêm vào tập hợp.


Bước 4: Kiểm tra xem đã đủ gần giải pháp tối ưu chưa. Nếu chưa, quay lại Bước 2.


Mỗi vòng lặp, tập hợp chỉ tăng thêm một điểm đỉnh. Dù chạy 100 vòng, bạn cũng chỉ cần theo dõi 100 điểm đỉnh - không phải 2^63 điểm.


Quy trình lặp của Frank-Wolfe


Hãy tưởng tượng bạn đang ở trong một mê cung lớn tìm lối thoát.


Phương pháp dã man là đi qua từng con đường. Phương pháp của Frank-Wolfe là: đầu tiên đi một con đường ngẫu nhiên, sau đó tại mỗi ngã đường hỏi một "hướng dẫn" (bộ giải lập trình số nguyên): "Từ đây, hướng nào có khả năng dẫn tới lối thoát nhất?" Sau đó đi theo hướng đó 1 bước. Bạn không cần khám phá toàn bộ mê cung, chỉ cần đưa ra lựa chọn đúng tại mỗi điểm quan trọng.


Bộ giải lập trình số nguyên: "Hướng dẫn" mỗi bước


Mỗi vòng lặp của Frank-Wolfe đều cần giải một bài toán lập trình tuyến tính số nguyên. Điều này trong lý thuyết là NP khó (nghĩa là "không có thuật toán chung hiệu quả được biết đến").


Nhưng các bộ giải hiện đại, như Gurobi[8], có thể giải quyết hiệu quả đối với các vấn đề có cấu trúc tốt.


Đội nghiên cứu đã sử dụng Gurobi 5.5. Thời gian thực tế để giải quyết:


• Vòng lặp đầu tiên (có ít trận đã kết thúc): Dưới 1 giây


• Giữa chặng đường (30-40 trận đã kết thúc): 10-30 giây


• Trễ (50+ trận đấu đã kết thúc): Dưới 5 giây


Tại sao trong trễ lại nhanh hơn? Bởi vì khi kết quả của trận đấu được xác định, không gian giải pháp hợp lý thu hẹp lại. Biến ít đi, ràng buộc chặt hơn, giải quyết nhanh hơn.


Vấn đề nổ gradient và Barrier Frank-Wolfe


Frank-Wolfe tiêu chuẩn gặp vấn đề kỹ thuật: Khi giá gần 0, gradient của LMSR sẽ tiến gần về âm vô cùng. Điều này dẫn đến thuật toán không ổn định.


Giải pháp là Barrier Frank-Wolfe: Không tối ưu trên toàn bộ đa diện M, mà tối ưu trên một phiên bản "co lại" hơn M một chút. Tham số co lại ε sẽ tự động giảm dần theo từng vòng lặp - ban đầu cách biên xa một chút (ổn định), sau này từ từ tiến gần tới biên thực sự (chính xác).


Nghiên cứu cho thấy, cần khoảng 50 đến 150 vòng lặp để hội tụ.


Hiệu suất Thực tế


Có một phát hiện then chốt trong bài báo [2]:


Trong 16 trận đầu của giải NCAA, thương nhân Franklin-Wolfe (FWMM) và thương nhân có ràng buộc tuyến tính đơn giản (LCMM) có hiệu suất tương đương - vì bộ giải quyết toàn số còn quá chậm chạp.


Nhưng sau 45 trận đấu, lần đầu tiên, một phân biệt thời gian 30 phút đã hoàn thành.


Từ đó, FWMM trong việc định giá Hải lúa tốt hơn LCMM 38%.


Điểm quan trọng là: Khi không gian kết quả thu hẹp lại đến mức bộ giải quyet toàn số hoàn thành trong khung thời gian giao dịch.


FWMM giống như một học sinh, trong nửa đầu của bài kiểm tra vẫn đang luyện tập, nhưng khi bước vào trạng thái, họ bắt đầu ủ rũ. LCMM là học sinh ổn định hiệu quả nhưng có giới hạn. Sự khác biệt chính là: FWMM có vũ khí mạnh hơn (Bregman projection), chỉ là cần thời gian để "nạp đạn" (đợi bộ giải quyết chạy xong).


Chương 4: Thực Thi - Tại sao tính toán ra cũng có thể lỗ


Bạn phát hiện có cơ hội tìm kiếm lợi nhuận. Bạn sử dụng Bregman projection để tính toán giao dịch tối ưu.


Bây giờ bạn cần thực hiện.


Đây là nơi mà hầu hết các chiến lược thất bại.


Vấn đề Thực hiện Không Phân lập


Polymarket sử dụng CLOB (Sổ đặt lệnh giới hạn trung tâm) [9].Không giống như sàn giao dịch phi trung tâm, các giao dịch trên CLOB được thực hiện theo thứ tự—bạn không thể đảm bảo tất cả các lệnh được thực hiện cùng một lúc.


Kế hoạch Arbitrage của bạn:


Mua YES, giá $0.30. Mua NO, giá $0.30. Tổng chi phí $0.60. Nhận lại $1.00 dù kết quả như thế nào. Lợi nhuận $0.40.


Thực tế:


• Gửi lệnh YES → Giá thực hiện $0.30 ✓

• Lệnh của bạn đã thay đổi giá thị trường.

• Gửi lệnh NO → Giá thực hiện $0.78 ✗

• Tổng chi phí: $1.08. Nhận lại: $1.00. Kết quả thực tế: Mất $0.08.


Một chân thực hiện, chân còn lại không.Bạn đã bị lộ.


Đây là lý do tại sao bài báo chỉ tính các cơ hội lợi nhuận lớn hơn $0.05.Sự chênh lệch giá nhỏ hơn sẽ bị ăn mất bởi rủi ro thực hiện.


Rủi ro Thực hiện Không Phân lập


VWAP: Giá Thực hiện Thực sự


Không nên giả định bạn sẽ giao dịch theo giá báo. Bạn cần tính Giá trung bình thực hiện theo tổng khối lượng (VWAP) [10].


Phương pháp của nhóm nghiên cứu là: Đối với mỗi khối trên chuỗi Polygon (khoảng 2 giây), tính toán VWAP của tất cả các giao dịch YES trong khối đó và tất cả các giao dịch NO trong khối đó.Nếu |VWAP_yes + VWAP_no - 1.0| > 0.02, được ghi nhận là một cơ hội Arbitrage [2].


VWAP chính là "Giá trung bình thực tế mà bạn trả". Nếu bạn muốn mua 10,000 token, nhưng trên sổ đặt lệnh, $0.30 chỉ có 2,000 token, $0.32 có 3,000 token, $0.35 có 5,000 token—VWAP của bạn sẽ là (2000×0.30 + 3000×0.32 + 5000×0.35) / 10000 = $0.326. Đắt hơn nhiều so với "giá tốt nhất" mà bạn thấy $0.30.


Ràng Buộc Thanh Khoản: Lợi Nhuận Có Thể Đạt Được Phụ Thuộc vào Độ Sâu của Sổ Đặt Hàng


Ngay cả khi giá cả có chênh lệch, lợi nhuận mà bạn có thể đạt được cũng bị hạn chế bởi thanh khoản có sẵn.


Ví dụ thực [2]:


Thị trường hiển thị Cơ Hội Arbitrage: CÓ Tổng Giá = $0.85. Lợi nhuận tiềm năng: Mỗi đô la $0.15. Nhưng độ sâu của sổ đặt hàng trên các mức giá này chỉ có $234. Lợi nhuận tối đa có thể đạt được: $234 × 0.15 = $35.10.


Đối với Arbitrage qua các thị trường, bạn cần có thanh khoản trên tất cả các vị trí cùng một lúc. Số nhỏ nhất sẽ quyết định giới hạn của bạn.


Điều này cũng là lý do tại sao, trên các nền tảng lượng tử học hiện tại, việc trình bày ảnh hưởng của giá đặt hàng đến giá thực thi là rất quan trọng.



Chương Năm: Hệ Thống Đầy Đủ — Đã Triển Khai Gì Trong Thực Tế


Lý thuyết là sạch sẽ. Môi trường sản xuất là hỗn loạn.


Đây là hình ảnh thực sự của một hệ thống Arbitrage có thể chạy [2].


Ống Dẫn Dữ Liệu


Dữ Liệu Thời Gian Thực: Kết nối WebSocket với API của Polymarket [9], nhận cập nhật Sổ Đặt Hàng (thay đổi giá/số lượng), thông báo giao dịch, sự kiện tạo/định giá thị trường.


Dữ Liệu Lịch Sử: Thực hiện truy vấn API Node Alchemy Polygon để lấy thông tin sự kiện hợp đồng — OrderFilled (thực thi giao dịch), PositionSplit (tạo mới mã thông báo), PositionsMerge (hủy mã thông báo).


Nhóm nghiên cứu đã phân tích 86 triệu giao dịch [2]. Mức độ này đòi hỏi cơ sở hạ tầng, không phải là mã script có thể xử lý.


Hiện tại, cũng có kế hoạch phát hành mã nguồn mở cho API giao dịch nhanh, nếu bạn có kế hoạch sử dụng mô hình giao dịch tương tự, hy vọng có thể trải nghiệm API ngay khi có, bạn cũng có thể luôn gửi tin nhắn cho tôi bất cứ lúc nào.


Tầng Phát Hiện Mối Quan Hệ


Đối với 305 thị trường cược bầu cử Mỹ, có 46,360 cặp kết hợp có thể cần được kiểm tra. Việc phân tích thủ công là không khả thi.


Nhóm nghiên cứu đã sử dụng một phương pháp thông minh: sử dụng mô hình ngôn ngữ lớn DeepSeek-R1-Distill-Qwen-32B để thực hiện sàng lọc ban đầu.


Đầu vào: Mô tả điều kiện của hai thị trường. Đầu ra: JSON của các kết hợp kết quả hợp lệ.


Sau đó, thực hiện ba lớp xác thực: Mỗi thị trường có chính xác một điều kiện đúng không? Số kết hợp hợp lệ có ít hơn n × m (có sự phụ thuộc) không? Tập con phụ thuộc có thỏa mãn điều kiện cơ hội lợi nhuận?


Kết quả: 40,057 cặp độc lập (không có cơ hội lợi nhuận) → 1,576 cặp có sự phụ thuộc (có cơ hội lợi nhuận tiềm năng) → 374 cặp thỏa mãn điều kiện nghiêm ngặt → 13 cặp được xác minh bằng tay có thể tận dụng [2].


Độ chính xác của LLM trên thị trường nhiều điều kiện phức tạp là 81.45%. Đủ để thực hiện sàng lọc ban đầu, nhưng cần xác minh bằng tay trước khi thực thi.


Bộ Tối Ưu Hóa Ba Lớp


· Lớp đầu tiên: Ràng buộc tuyến tính đơn giản (LCMM). Nhanh chóng kiểm tra các quy tắc cơ bản - "Tổng xác suất bằng 1", "Nếu A suy ra B, thì P(A) không thể lớn hơn P(B)". Hoàn thành trong vài mili giây, loại bỏ những lỗi giá rõ ràng.


· Lớp thứ hai: Chiếu mỹ thuật toán số nguyên (Frank-Wolfe + Gurobi). Đây là cốt lõi. Tham số: Alpha = 0.9 (rút trích ít nhất 90% cơ hội lợi nhuận), ε ban đầu = 0.1 (co giãn 10%), ngưỡng hội tụ = 1e-6, giới hạn thời gian = 30 phút. Số lần lặp điển hình: 50-150 lần. Thời gian giải quyết mỗi lần lặp: 1-30 giây.


· Lớp thứ ba: Xác thực thực thi. Trước khi gửi lệnh, mô phỏng giao dịch trên sổ đặt hàng hiện tại. Kiểm tra: Khả năng thanh khoản có đủ không? Slippage dự kiến là bao nhiêu? Lợi nhuận sau khi trừ đi slippage là bao nhiêu? Lợi nhuận có vượt qua ngưỡng tối thiểu ($0.05) không? Chỉ thực thi khi tất cả điều kiện đều được thỏa mãn.


Quản Lý Vị Thế: Biến Thể Cải Tiến Của Công Thức Kelly


Công thức Kelly tiêu chuẩn [11] cho bạn biết bạn nên đầu tư bao nhiêu phần trăm vốn vào mỗi giao dịch. Nhưng trong kịch bản cơ hội lợi nhuận, cần phải bao gồm điều chỉnh rủi ro thực hiện:


f = (b×p - q) / b × √p


Trong đó b là tỷ lệ lợi nhuận từ cơ hội cắt lỗ, p là xác suất thực hiện đầy đủ (ước lượng dựa trên độ sâu của sổ lệnh), q = 1 - p.


Giới hạn: 50% độ sâu của sổ lệnh. Vượt qua tỷ lệ này, đơn đặt hàng của bạn sẽ di chuyển thị trường mạnh mẽ.


Kết quả Cuối cùng


Từ tháng 4 năm 2024 đến tháng 4 năm 2025, Lợi nhuận rút ra tổng cộng:


Cơ hội cắt lỗ Đơn lẻ: Mua thấp hai bên $5,899,287 + Bán cao hai bên $4,682,075 = $10,581,362


Cân bằng thị trường: Mua tất cả YES thấp $11,092,286 + Bán tất cả YES cao $612,189 + Mua tất cả NO $17,307,114 = $29,011,589


Cơ hội cắt lỗ Kết hợp qua Thị trường: $95,634


Tổng cộng: $39,688,585


10 nhà cái hàng đầu rút ra $8,127,849 (20.5% tổng số). Người giành hạng nhất: $2,009,632, từ 4,049 giao dịch, trung bình mỗi giao dịch $496[2].


Không phải là xổ số. Không phải là may mắn. Đó là thực hiện hệ thống chính xác toán học.


Thực tế Cuối cùng


Khi nhà giao dịch vẫn đang đọc "10 Mẹo Dự báo Thị trường", hệ thống định lượng đang làm gì?


Chúng đang sử dụng quy hoạch số nguyên để phát hiện mối quan hệ giữa 17,218 điều kiện. Đang tính giao dịch cắt lỗ tối ưu bằng phép chiếu Bregman. Chạy thuật toán Frank-Wolfe để xử lý đào lũ độ gradient. Ước lượng slippage bằng VWAP và thực hiện giao dịch song song. Một cách hệ thống rút ra lợi nhuận đảm bảo $40 triệu.


Sự khác biệt không phải là may mắn. Đó là hạ tầng toán học.


Bài báo là công khai [1]. Thuật toán là đã biết. Lợi nhuận là thực.


Vấn đề là: trước khi rút ra 40 triệu tiếp theo, bạn có thể xây dựng được không?


Tra cứu Khái niệm


• Biểu đa diện (Marginal Polytope) → Không gian gồm tất cả các "giá trị hợp lệ". Giá cả phải nằm trong không gian này mới không có cơ hội thực thi giải trích. Có thể hiểu là "vùng giá trị hợp lệ của giá cả"


• Lập kế hoạch số nguyên (Integer Programming) → Sử dụng các ràng buộc tuyến tính mô tả kết quả hợp lệ, tránh sử dụng phương pháp liệt kê mò. Nén 2^63 trường hợp kiểm tra thành vài ràng buộc [3]


• Độ lệch Bregman / Độ lệch KL → Phương pháp đo "khoảng cách" giữa hai phân phối xác suất, thích hợp hơn so với khoảng cách Euclid trong các tình huống giá cả/xác suất. Trọng số thay đổi gần giá trị cực đại cao hơn [5][6]


• LMSR (Luật tính điểm thị trường logarit) → Cơ chế định giá được thị trường Polymarket sử dụng, giá cả đại diện cho xác suất ẩn [4]


• Thuật toán Frank-Wolfe → Một loại thuật toán tối ưu hóa từng bước, mỗi vòng chỉ thêm một điểm mới, tránh việc liệt kê các kết quả hợp lệ theo cấp số nhân [7]


• Gurobi → Bộ giải toán lập kế hoạch số nguyên hàng đầu trong ngành, là "hướng dẫn viên" cho mỗi vòng lặp của Frank-Wolfe [8]


• CLOB (Sổ lệnh giới hạn trung tâm) → Cơ chế phù hợp lệnh Polymarket, thực hiện lệnh theo thứ tự, không đảm bảo tính nguyên tử [9]


• VWAP (Giá trung bình có trọng số theo khối lượng giao dịch) → Giá trung bình thực tế bạn đã trả, xem xét sâu độ của sổ lệnh. Thực tế hơn so với "giá mua tối ưu" [10]


• Công thức Kelly → Cho bạn biết nên đầu tư bao nhiêu phần trăm vốn vào một giao dịch, cân bằng lợi nhuận và rủi ro [11]


• Thực thi không nguyên tử → Vấn đề khi nhiều lệnh đồng thời không đảm bảo cùng thực hiện. Một chân thực hiện, chân khác không thể = Rủi ro lộ mối


• DeepSeek → Một công cụ ngôn ngữ lập trình lớn được sử dụng để sàng lọc sơ bộ mối quan hệ thị trường, độ chính xác 81,45%


Tài liệu Tham khảo
[1] Nguyên tác: https://x.com/RohOnChain/status/2017314080395296995
[2] Bài báo nghiên cứu "Unravelling the Probabilistic Forest: Arbitrage in Prediction Markets": https://arxiv.org/abs/2508.03474
[3] Bài báo cơ bản "Arbitrage-Free Combinatorial Market Making via Integer Programming": https://arxiv.org/abs/1606.02825
[4] Giải thích Luật tính điểm thị trường logarit LMSR: https://www.cultivatelabs.com/crowdsourced-forecasting-guide/how-does-logarithmic-market-scoring-rule-lmsr-work
[5] Giới thiệu về Độ lệch Bregman: https://mark.reid.name/blog/meet-the-bregman-divergences.html
[6] Độ lệch KL - Wikipedia: https://en.wikipedia.org/wiki/Kullback%E2%80%93Leibler_divergence
[7] Thuật toán Frank-Wolfe - Wikipedia: https://en.wikipedia.org/wiki/Frank%E2%80%93Wolfe_algorithm
[8] Trình giải quyết lập kế hoạch số nguyên Gurobi: https://www.gurobi.com/
[9] Tài liệu API sổ lệnh giới hạn trung tâm Polymarket: https://docs.polymarket.com/
[10] Giải thích VWAP - Investopedia: https://www.investopedia.com/terms/v/vwap.asp
[11] Công thức Kelly - Investopedia: https://www.investopedia.com/articles/trading/04/091504.asp
[12] Bản tin Decrypt "The $40 Million Free Money Glitch": https://decrypt.co/339958/40-million-free-money-glitch-crypto-prediction-markets


Liên kết gốc


Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:

Nhóm Telegram đăng ký: https://t.me/theblockbeats

Nhóm Telegram thảo luận: https://t.me/BlockBeats_App

Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia

Chọn thư viện
Thêm mới thư viện
Hủy
Hoàn thành
Thêm mới thư viện
Chỉ mình tôi có thể nhìn thấy
Công khai
Lưu
Báo lỗi/Báo cáo
Gửi