Cuộc cạnh tranh về dữ liệu giữa các gã khổng lồ AI đang ngày càng gay gắt.
Gần đây, Đài Phát thanh Truyền hình Anh (BBC) đã gửi thư luật sư tới công cụ tìm kiếm AI Perplexity, cáo buộc công ty này thu thập và đào tạo nội dung của BBC mà không được phép. BBC đã yêu cầu Perplexity ngừng thu thập, xóa dữ liệu đã được sử dụng để đào tạo và đề xuất một kế hoạch bồi thường tài chính, nếu không sẽ tìm kiếm lệnh cấm của tòa án. Điều này đánh dấu sự căng thẳng lâu dài giữa phương tiện truyền thông và AI tạo sinh đã hoàn toàn nổi lên - dữ liệu không phải là một bữa tiệc công cộng và hướng bản quyền đang yêu cầu thanh toán từ các mô hình AI sử dụng nội dung của nó mà không được phép.
Gần như cùng lúc đó, Meta đã chi 14,8 tỷ đô la để mua lại 49% cổ phần của kỳ lân chú thích dữ liệu AI Scale AI, đưa nhà sáng lập 28 tuổi Alexandr Wang và nhóm của anh vào cuộc. Google và các đối thủ cạnh tranh khác ngay lập tức thông báo rằng họ sẽ tìm một nhà cung cấp dữ liệu khác để tránh bị nghi ngờ. Có thông tin cho rằng Google, một công ty con của Alphabet, đã quyết định cắt đứt hợp tác với Scale AI. Có thể thấy sự đồng thuận trong ngành rằng "ai kiểm soát dữ liệu thì có quyền sinh sát" đang ngày càng gia tăng.
Một mặt, những người nắm giữ bản quyền đang bảo vệ nghiêm ngặt, mặt khác, các gã khổng lồ sẵn sàng chi rất nhiều tiền để cạnh tranh dữ liệu. Dữ liệu đã trở thành nguồn tài nguyên chiến lược đắt đỏ và nhạy cảm nhất trong lĩnh vực AI. Tuy nhiên, khi dữ liệu khổng lồ bị một vài gã khổng lồ tập trung độc quyền, ngưỡng cho sự đổi mới AI sẽ tăng lên, và nhiều tranh chấp bản quyền cũng như các vùng xám về tuân thủ cũng sẽ xuất hiện. Trong khoảng cách giữa cuộc chạy đua dữ liệu này và cuộc chiến bảo vệ bản quyền, một mô hình thu thập dữ liệu mới mang tính phi tập trung, có động lực nội tại và hướng đến người dùng thông thường trên toàn thế giới sắp xuất hiện. Đây chính xác là lối thoát mà OORT muốn cung cấp.
Là một đơn vị chuyên về các giải pháp dữ liệu AI phi tập trung, OORT gần đây đã đạt được một cột mốc quan trọng: ứng dụng cốt lõi DataHub của họ đã có mặt trên ví phi tập trung Binance vào cuối tháng 6, trở thành ứng dụng thu thập dữ liệu DeAI (trí tuệ nhân tạo phi tập trung) đầu tiên được tích hợp vào Ví Binance. Điều này có nghĩa là OORT đã tiếp cận được cộng đồng tiền điện tử rộng lớn hơn và mở ra một kênh mới cho hàng trăm triệu người dùng Binance kiếm tiền từ dữ liệu.
Với sự tích hợp này, hơn 486 triệu người dùng tiềm năng trên toàn thế giới có thể trực tiếp tham gia vào các tác vụ dữ liệu trên nền tảng OORT thông qua Ví Binance, chẳng hạn như phân loại hình ảnh, xác minh nội dung và chú thích dữ liệu, đồng thời nhận phần thưởng tức thì (USDT hoặc token OORT) tùy theo tác vụ. Mô hình này cung cấp sự bổ sung mạnh mẽ cho việc thu thập dữ liệu đào tạo AI - không giống như phương pháp thu thập tập trung truyền thống tốn kém và kém hiệu quả, một lượng lớn lao động nhỏ của người dùng thông thường liên tục được tập hợp thành một nhóm dữ liệu chất lượng cao.
Cơ chế khuyến khích của OORT DataHub đã cho thấy sức hút mạnh mẽ. Tính đến nay, số lượng người dùng đã đăng ký trên nền tảng đã vượt quá 300.000 và hơn 80.000 người dùng tích cực tham gia đóng góp dữ liệu mỗi tuần. Hơn 50.000 nút dữ liệu OORT phân bổ tại 107 quốc gia và khu vực trên toàn thế giới tạo thành một mạng lưới khổng lồ, bao gồm cả người dùng cá nhân và các nhà cung cấp năng lực tính toán và lưu trữ cấp doanh nghiệp.
Điều đáng chú ý là OORT đã hợp tác với các công ty lớn trong ngành như Lenovo, Dell, Seagate và Tencent Cloud để cung cấp hỗ trợ phần cứng và chứng thực cơ sở hạ tầng đám mây cho mạng dữ liệu phi tập trung của mình. Sự mở rộng nhanh chóng và hợp tác công nghiệp của mạng lưới nút này cho thấy hệ sinh thái dữ liệu phi tập trung đang mở ra khoảnh khắc "đặc thù" của riêng nó: dữ liệu không còn chỉ là tài nguyên độc quyền của các công ty lớn nữa mà sẽ được sở hữu chung và chia sẻ bởi hàng nghìn nút riêng lẻ.
Như đã đề cập ở trên, các vụ kiện bản quyền và tranh chấp quyền riêng tư vẫn tiếp diễn, và ngành công nghiệp AI đang phải đối mặt với những thách thức chưa từng có về tính hợp pháp. Là một công ty cơ sở hạ tầng dữ liệu AI phi tập trung, OORT cung cấp giải pháp hoàn chỉnh bao gồm thu thập, lưu trữ và tính toán dữ liệu. Ma trận sản phẩm cốt lõi của công ty được gọi một cách sinh động là bộ ba AI phi tập trung:
Đầu tiên là OORT DataHub. Đây là một nền tảng thu thập và chú thích dữ liệu phi tập trung dành cho người dùng toàn cầu. Tại đây, bất kỳ ai cũng có thể hoàn thành các tác vụ dữ liệu ngắn thông qua điện thoại di động hoặc máy tính để đóng góp tài liệu đào tạo cho các mô hình AI, bao gồm chụp và tải ảnh, ghi âm giọng nói, chú thích văn bản, đánh giá nội dung, v.v. DataHub có cơ chế khuyến khích kinh tế tiền điện tử tinh vi tích hợp sẵn: mỗi khi người dùng hoàn thành một tác vụ dữ liệu, hệ thống sẽ phát hành token USDT hoặc OORT để đền bù theo thời gian thực. Mô hình "nhiệm vụ nhỏ, phần thưởng ngay lập tức" này, một mặt, cung cấp cho các nhà nghiên cứu và nhà phát triển một luồng dữ liệu mới, đa dạng và chất lượng cao, giảm nguy cơ sai lệch và lão hóa các tập dữ liệu đào tạo. Mặt khác, nó cũng cho phép người dùng thông thường thực sự chia sẻ giá trị gia tăng của ngành công nghiệp AI - đúng như OORT ủng hộ, những cá nhân tham gia đóng góp dữ liệu sẽ trở thành các bên liên quan trong hệ sinh thái AI, chứ không phải là những "nhà cung cấp dữ liệu" bị lợi dụng. Hiện tại, các tập dữ liệu cộng đồng được tổng hợp thông qua DataHub đã cho thấy những kết quả đáng ngạc nhiên: các tập dữ liệu do cộng đồng OORT đóng góp nằm trong số những tập dữ liệu tốt nhất trong nhiều hạng mục của Kaggle, nền tảng cạnh tranh dữ liệu của Google. Điều này xác minh mạnh mẽ độ tin cậy của chất lượng dữ liệu theo mô hình phi tập trung - dữ liệu được thu thập bởi các cá nhân ban đầu phân tán lỏng lẻo trên khắp thế giới có thể đạt đến mức độ hàng đầu trong ngành miễn là chúng được khuyến khích và xác minh đúng cách.
Thứ hai là OORT Storage. Đây là một mạng lưu trữ dữ liệu phi tập trung hoạt động chặt chẽ với DataHub. Khi một lượng lớn dữ liệu thô đa dạng được thu thập từ phía người dùng Datahub, làm thế nào để lưu trữ chúng một cách an toàn, hiệu quả và thuận tiện cho các lần gọi tiếp theo? Câu trả lời mà OORT đưa ra là xây dựng một hệ thống lưu trữ được mã hóa phân tán, phân chia và mã hóa dữ liệu rồi lưu trữ trên các nút trên toàn thế giới. So với lưu trữ đám mây tập trung truyền thống, OORT Storage có ưu điểm là bảo vệ quyền riêng tư dữ liệu và giảm chi phí: dữ liệu khó bị đánh cắp bởi các cuộc tấn công đơn điểm hơn do lưu trữ phi tập trung, và sự cạnh tranh và hợp tác giữa các nút cũng mang lại hiệu suất chi phí lưu trữ tốt hơn.
Thứ ba là OORT Compute. Đây là lớp năng lực tính toán phi tập trung do OORT xây dựng, có chức năng xác minh và chú thích dữ liệu bằng cách tích hợp năng lực tính toán của các nút biên. Nói một cách đơn giản, OORT Compute tập hợp các tài nguyên tính toán nhàn rỗi từ các nút khác nhau (bao gồm thiết bị biên Deimos của OORT, máy tính cá nhân và thậm chí cả máy chủ doanh nghiệp) để tạo thành một mạng siêu máy tính phi tập trung. Mỗi nút sẽ chạy một thuật toán I được tạo sẵn để xác minh và gắn nhãn dữ liệu, biến lượng lớn dữ liệu thô được thu thập bởi trung tâm dữ liệu thành một tập dữ liệu chất lượng cao có thể được sử dụng trực tiếp để đào tạo mô hình AI. Thông qua liên kết của giao thức chuỗi khối OORT Olympus, OORT Compute và OORT Storage đã đề cập ở trên cùng nhau tạo thành cơ sở hạ tầng phi tập trung của OORTDatahub - hiện thực hóa giải pháp toàn diện từ thu thập dữ liệu, làm sạch và gắn nhãn.
Nhiều dự án chuỗi khối đã bắt đầu thử kết hợp với AI, nhưng có một vấn đề nghiêm trọng về các đảo chuỗi: các chuỗi khác nhau không thể giao tiếp thông suốt và mỗi chuỗi hoạt động độc lập và DeAI không thể thực sự phát huy hết tiềm năng của mình. Nó giống như những chiếc máy tính trước khi Internet ra đời. Mặc dù mỗi máy tính đều mạnh mẽ, nhưng sức mạnh của chúng bị giảm đi rất nhiều vì không thể kết nối với Internet.
AI tập trung truyền thống phụ thuộc vào các đảo dữ liệu của doanh nghiệp. Nếu DeAI không thể giải quyết được vấn đề đảo dữ liệu giữa các chuỗi, nó cũng có thể rơi vào cái bẫy tương tự. Các giao thức, hợp đồng thông minh và môi trường máy ảo của các chuỗi khác nhau rất khác nhau, khiến việc tương tác giữa dữ liệu AI và mô hình xuyên chuỗi trở nên cực kỳ khó khăn.
OORT độc đáo ở chỗ nó không bị giới hạn trong một chuỗi duy nhất, mà trực tiếp cung cấp các dịch vụ thu thập, lưu trữ và tính toán dữ liệu xuyên chuỗi thông qua giao thức Olympus, giải quyết vấn đề cô lập giữa các chuỗi và mở ra liên kết chính của DeAI. Nói một cách đơn giản, OORT giống như một lỗ khóa, cho phép dữ liệu và sức mạnh tính toán trên các chuỗi khác nhau giao tiếp trơn tru, cho phép các nhà phát triển tập trung vào các nhiệm vụ cốt lõi của dữ liệu và AI, và không còn phải bận tâm đến sự phức tạp của xuyên chuỗi.
So với các dự án khác, giải pháp chuỗi chéo của OORT không chỉ có thể giải quyết hiệu quả các vấn đề cũ mà AI tập trung gặp phải, chẳng hạn như quyền riêng tư dữ liệu và tranh chấp bản quyền, mà còn cải thiện tính đa dạng và quy mô thu thập dữ liệu theo cách khuyến khích blockchain minh bạch. Thiết kế này cũng cho phép người dùng lấy lại quyền kiểm soát dữ liệu và tham gia vào việc chia sẻ giá trị của ngành công nghiệp AI.
Do đó, chìa khóa để OORT trở thành lỗ khóa của DeAI là nó không chỉ phá vỡ các rào cản của các đảo dữ liệu mà còn cung cấp một con đường thiết thực để xác định lại quyền sở hữu dữ liệu và các quy tắc chia sẻ, mang lại khả năng hạ cánh thực sự cho hệ sinh thái AI phi tập trung.
Cho dù đó là tranh chấp bản quyền giữa BBC và Perplexity, hay trò chơi vũ khí dữ liệu giữa các gã khổng lồ công nghệ xung quanh Scale AI, về cơ bản chúng đều phản ánh cùng một vấn đề: sự phát triển của AI đang chạm đến ranh giới của bản đồ lợi ích truyền thống. Lượng dữ liệu chất lượng cao khổng lồ là nhiên liệu cho các mô hình AI, nhưng phương pháp, chi phí, quyền lợi và lợi ích của việc thu thập những dữ liệu này vẫn chưa được giải quyết thỏa đáng trong một thời gian dài. Trước đây, "chặng đường cuối cùng" của việc gắn nhãn và thu thập dữ liệu thường bị che giấu sau bức màn hào nhoáng của ngành công nghiệp AI, và được hàng ngàn người gắn nhãn và người dùng ẩn danh âm thầm đóng góp, nhưng rất khó để nhận được phần thưởng và sự tôn trọng xứng đáng. Mô hình phi tập trung do OORT đề xuất là thực sự trả lại "chặng đường cuối cùng" của AI này cho người dùng.
Thông qua OORT, lần đầu tiên chúng ta thấy được mối liên hệ trực tiếp như vậy giữa người dân bình thường và sự phát triển của AI: mọi người đều có thể sử dụng thời gian bị phân mảnh để đóng góp nhỏ nhưng thực sự cho mô hình AI toàn cầu và nhận được lợi nhuận ngay lập tức và công bằng dưới dạng tiền điện tử. Mô hình này phá vỡ các giới hạn về địa lý và thể chế, đồng thời tập hợp sức mạnh cá nhân ban đầu phân tán trên khắp thế giới thành một động lực thúc đẩy AI phát triển, biến sự phát triển AI không còn là đặc quyền độc quyền của những gã khổng lồ, mà là một sự nghiệp hợp tác cho sự tham gia của công chúng.
Chào mừng bạn tham gia cộng đồng chính thức của BlockBeats:
Nhóm Telegram đăng ký: https://t.me/theblockbeats
Nhóm Telegram thảo luận: https://t.me/BlockBeats_App
Tài khoản Twitter chính thức: https://twitter.com/BlockBeatsAsia