Testnet

Verde: Hệ thống xác minh học máy trên các nút không đáng tin cậy

Đây là một bài báo học thuật mô tả Verde – một giao thức xác minh cho các chương trình máy học, cùng với hệ thống Toán tử Tái tạo (Reproducible Operators – RepOps) nền tảng giúp enable nó. RepOps là một thư viện đảm bảo khả năng tái tạo theo từng bit (bitwise reproducibility) cho công việc ML trên các phần cứng đa dạng.

Mạng Gensyn tạo ra một thị trường tính toán tự do toàn cầu cho học máy. Nó cho phép bất kỳ người dùng nào cung cấp tài nguyên — từ các trung tâm dữ liệu đến MacBook — trong khi đảm bảo việc thực thi đồng nhất trên tất cả các thiết bị. Điều này giúp các nhà phát triển huấn luyện các mô hình quy mô cực lớn với chi phí thấp và mở ra những hình thức học hợp tác mới, điều trước đây là không thể.

Để hiện thực hóa khái niệm này, chúng ta cần một cơ chế để kiểm tra công việc của các nhà cung cấp không đáng tin cậy theo cách có thể mở rộng. Cách tiếp cận ngây thơ sẽ là sử dụng một trung gian đáng tin cậy để tái tạo mỗi nhiệm vụ hoặc đưa các nhà cung cấp vào danh sách trắng của các bên đáng tin cậy. Trong cả hai trường hợp, chúng ta sẽ nhanh chóng gặp phải các hạn chế về khả năng mở rộng: trong trường hợp đầu tiên, chi phí sao chép sẽ không thể chấp nhận được; trong trường hợp thứ hai, chúng ta sẽ loại trừ đuôi dài các nhà cung cấp muốn tham gia.

Các cách tiếp cận phức tạp hơn, chẳng hạn như các hệ thống chứng minh mật mã, đảm bảo tính chính xác nhưng chúng quá đắt đối với các công việc ML lớn (ít nhất là hiện nay). Các cách tiếp cận heuristic, chẳng hạn như Proof-of-Learning hoặc Proof-of-Training Data, cung cấp hiệu quả thông qua các bảo đảm an ninh yếu.

Chúng tôi thay vào đó sử dụng ý tưởng ủy quyền trọng tài, sử dụng các người kiểm tra để xác minh công việc của từng nhà cung cấp. Nếu người kiểm tra cho rằng kết quả của nhà cung cấp là sai, họ có thể sử dụng một trò chơi giải quyết tranh chấp hiệu quả để thuyết phục một trọng tài trung lập về điều đó. Các kỹ thuật này là nền tảng của xác minh lạc quan được sử dụng trong các blockchain rollups như Arbitrum và Optimism, nơi các validator blockchain đóng vai trò trọng tài. Tranh chấp về các khối giao dịch có thể được giải quyết…

Tuy nhiên, ủy quyền trọng tài không tương thích tốt với học máy hiện đại vì hai lý do. Thứ nhất, nó được phát triển cho các chương trình trên CPU và không hiệu quả khi áp dụng cho các mạng nơ-ron quy mô lớn. Thứ hai, nó giả định rằng các máy chủ trung thực luôn tính toán kết quả giống nhau cho cùng một chương trình, điều này thường không đúng trong học máy nếu họ sử dụng phần cứng khác nhau.

Mọi cơ chế khả thi phải giải quyết những vấn đề này một cách có thể mở rộng.

Giới thiệu Verde

Hôm nay, chúng tôi rất vui mừng giới thiệu Verde — giao thức xác minh đầu tiên được thiết kế đặc biệt cho học máy hiện đại trong các môi trường phân tán.

Verde bao gồm một hệ thống giải quyết tranh chấp nhẹ nhàng, xác định bước đầu tiên của việc huấn luyện và toán tử trong đồ thị tính toán của mạng nơ-ron, nơi huấn luyện viên và người kiểm tra không đồng ý. Giờ đây, thay vì thực hiện lại toàn bộ nhiệm vụ, các trọng tài, có thể là smart contract hoặc bồi thẩm đoàn các người kiểm tra, chỉ tính toán lại toán tử tranh chấp này. Điều này làm giảm đáng kể chi phí xác minh, đồng thời đảm bảo rằng nếu ít nhất một người kiểm tra trung thực, kết quả đúng sẽ được đảm bảo

Tái tạo

Để hệ thống này hoạt động, chúng tôi cần các chương trình học máy phải có thể tái tạo trên tất cả các cài đặt phần cứng, sao cho các nút khác nhau (trung thực) sẽ tính toán kết quả giống nhau, bất kể thiết bị họ sử dụng là gì. Thông thường, điều này không xảy ra mặc định, ngay cả đối với các thiết bị của cùng một nhà sản xuất (ví dụ, Nvidia A100 so với H100).

Để giải quyết vấn đề này, chúng tôi đã tạo ra Reproducible Operators (RepOps), một thư viện thực hiện các phiên bản tái tạo bit của các toán tử ML phổ biến. Điều này giải quyết vấn đề phi quyết định phần cứng, đảm bảo thứ tự cố định khi thực hiện các phép toán dấu phẩy động khi tính toán các hàm như nhân ma trận. Điều này đảm bảo rằng các nhà cung cấp trung thực luôn trả về kết quả giống hệt bit, cho phép giao thức giải quyết tranh chấp Verde hoạt động đáng tin cậy.

Kết luận

Verde cung cấp một thành phần cơ bản cho học máy phân tán. Nó cho phép Gensyn kết nối mọi thiết bị tính toán trên thế giới — từ các trung tâm dữ liệu đến các thiết bị ngoại vi — theo cách có thể mở rộng và không cần sự cấp phép.

Để tìm hiểu thêm về điều này, bạn có thể đọc tài liệu đầy đủ tại đây.

Để xem cách tái tạo hoạt động với RepOps trong một buổi trình diễn trực tiếp, hãy làm theo hướng dẫn tại đây.