Đạo luật AI của EU miễn trừ cho AI mã nguồn mở, nhưng vấn đề minh bạch dữ liệu huấn luyện vẫn gây tranh cãi

BigGo Editorial Team
Đạo luật AI của EU miễn trừ cho AI mã nguồn mở, nhưng vấn đề minh bạch dữ liệu huấn luyện vẫn gây tranh cãi

Sự giao thoa giữa các nguyên tắc mã nguồn mở và phát triển AI đang tạo ra nhiều cuộc tranh luận đáng kể trong cộng đồng công nghệ, đặc biệt khi các quy định và chính sách mới xuất hiện. Một bước phát triển quan trọng là Đạo luật AI của Liên minh châu Âu, trong đó đặc biệt miễn trừ các hệ thống AI mã nguồn mở khỏi một số yêu cầu quy định, ngoại trừ các hệ thống AI có rủi ro cao.

Các điều khoản về mã nguồn mở trong Đạo luật AI của EU

Đạo luật AI của EU bao gồm các miễn trừ đáng chú ý cho các hệ thống AI mã nguồn mở, quy định rằng các bên thứ ba cung cấp công khai các công cụ và thành phần AI theo giấy phép miễn phí và mã nguồn mở không bắt buộc phải tuân thủ trách nhiệm chuỗi giá trị. Tuy nhiên, miễn trừ này không áp dụng cho các hệ thống AI có rủi ro cao hoặc những hệ thống thuộc các điều khoản cụ thể.

Vấn đề nan giải về dữ liệu huấn luyện

Một điểm gây tranh cãi chính trong cộng đồng AI mã nguồn mở xoay quanh tính minh bạch của dữ liệu huấn luyện. Trong khi các nguyên tắc phần mềm mã nguồn mở truyền thống nhấn mạnh việc truy cập đầy đủ vào mã nguồn, lĩnh vực AI lại đặt ra những thách thức độc đáo:

  • Khả năng tiếp cận dữ liệu : Nhiều mô hình AI hiện tại được huấn luyện trên dữ liệu thu thập từ web, khiến việc phát hành toàn bộ bộ dữ liệu huấn luyện dưới giấy phép mã nguồn mở là điều gần như không thể
  • Quan ngại về khả năng tái tạo : Một số thành viên cộng đồng cho rằng việc cung cấp các script thu thập dữ liệu hoặc danh sách liên kết không đủ để đạt được trạng thái mã nguồn mở thực sự, vì không đảm bảo được khả năng tiếp cận dữ liệu trong tương lai
  • Các phương pháp thay thế : Các dự án như RNNoise đã chứng minh sự chuyển đổi thành công từ dữ liệu huấn luyện độc quyền sang tự do thông qua nỗ lực cộng đồng

Các tiêu chuẩn và chính sách mới nổi

Các tổ chức khác nhau đang phát triển cách tiếp cận riêng để giải quyết những thách thức này:

  1. Chính sách của Debian : Dự án Debian đã thiết lập các hướng dẫn cụ thể cho AI tự do, bao gồm khái niệm ToxicCandy Model để giải quyết các vấn đề liên quan đến AI
  2. Hướng đi mới của OSI : Tổ chức Open Source Initiative đang xây dựng Định nghĩa AI Mã nguồn Mở mới (OSAID) xem xét việc truy cập dữ liệu huấn luyện như một lợi ích thay vì một yêu cầu bắt buộc
  3. Cân nhắc của Codeberg : Nền tảng này hiện đang đánh giá Điều khoản Sử dụng liên quan đến việc phê duyệt giấy phép OSI dưới góc độ những phát triển mới này

Góc nhìn của cộng đồng

Cộng đồng công nghệ vẫn còn chia rẽ về định nghĩa AI mã nguồn mở thực sự. Một số người ủng hộ tính minh bạch hoàn toàn của dữ liệu huấn luyện, trong khi những người khác ủng hộ cách tiếp cận linh hoạt hơn, thừa nhận những giới hạn thực tế trong khi vẫn duy trì tinh thần của các nguyên tắc mã nguồn mở.

Cuộc tranh luận đang diễn ra này nhấn mạnh nhu cầu về các tiêu chuẩn rõ ràng, cân bằng giữa tính khả thi thực tế và các nguyên tắc cơ bản của phát triển phần mềm mã nguồn mở, đặc biệt khi công nghệ AI tiếp tục phát triển và tích hợp vào nhiều khía cạnh của việc phát triển phần mềm.