Việc Thu Thập Dữ Liệu Huấn Luyện AI Quy Mô Lớn của Nvidia Gây Ra Các Vấn Đề Pháp Lý và Đạo Đức

BigGo Editorial Team

Việc Thu Thập Dữ Liệu Huấn Luyện AI Quy Mô Lớn của Nvidia Gây Ra Các Vấn Đề Pháp Lý và Đạo Đức

Phương Pháp Huấn Luyện AI của Nvidia Bị Xem Xét Kỹ Lưỡng

Nvidia, gã khổng lồ GPU nổi tiếng với việc cung cấp sức mạnh cho các công nghệ AI tiên tiến, đang bị chỉ trích về cách thức thu thập dữ liệu. Các báo cáo gần đây tiết lộ công ty đã thu thập một lượng lớn nội dung video từ nhiều nguồn khác nhau để huấn luyện các mô hình AI, gây ra những lo ngại đáng kể về mặt pháp lý và đạo đức.

Quy Mô Thu Thập Dữ Liệu của Nvidia

Theo các tài liệu bị rò rỉ được điều tra bởi 404 Media, dự án nội bộ của Nvidia có tên mã Cosmos đã:

Tải xuống hàng triệu video mỗi ngày, tương đương với 80 năm nội dung
Tích lũy hơn 30 triệu URL chỉ trong một tháng
Sử dụng các nguồn bao gồm YouTube, Netflix và các nền tảng video khác
Sử dụng hàng chục máy tính ảo trên Amazon Web Services cho nhiệm vụ này

Ứng Dụng Dự Kiến

Nvidia được cho là nhằm sử dụng dữ liệu này để huấn luyện các mô hình AI cho:

Tạo thế giới 3D Omniverse
Phát triển xe tự lái
Tạo avatar kỹ thuật số
Các dự án AI thương mại khác

Các Vấn Đề Pháp Lý và Đạo Đức

Cách thức hoạt động của công ty đã gây ra tranh cãi về nhiều vấn đề:

Vi phạm bản quyền: Nhiều video được thu thập có thể được bảo vệ bởi bản quyền.
Vi phạm điều khoản dịch vụ: Việc tải xuống nội dung từ các nền tảng như YouTube thường vi phạm chính sách sử dụng của họ.
Bảo vệ dữ liệu cá nhân: Nội dung video có thể chứa thông tin cá nhân thuộc phạm vi quy định về quyền riêng tư.
Sử dụng học thuật so với thương mại: Một số bộ dữ liệu chỉ được dùng cho mục đích học thuật.

Phản Hồi của Nvidia

Khi được hỏi về những cách thức này, Nvidia tuyên bố họ tuân thủ đầy đủ cả tinh thần và chữ viết của luật bản quyền. Công ty lập luận rằng:

Luật bản quyền bảo vệ biểu đạt, không phải sự kiện hoặc ý tưởng
Việc huấn luyện AI thuộc phạm vi sử dụng hợp lý vì mục đích chuyển đổi

Tuy nhiên, cách diễn giải này bị phản đối bởi các nền tảng nội dung như YouTube, CEO Neal Mohan của họ đã tuyên bố rõ ràng rằng việc tải xuống nội dung video vi phạm điều khoản dịch vụ của họ.


Logo của OpenAI minh họa cho các cuộc thảo luận đang diễn ra trong ngành về các thông lệ AI có đạo đức và vấn đề bản quyền, liên quan đến phản hồi của Nvidia về việc sử dụng dữ liệu

Tác Động Toàn Ngành

Nvidia không phải là công ty duy nhất phải đối mặt với sự xem xét kỹ lưỡng về nguồn dữ liệu huấn luyện AI. Các công ty như OpenAI và Runway cũng đã phải đối mặt với những cáo buộc tương tự. Tranh cãi này nhấn mạnh nhu cầu cấp thiết về:

Tính minh bạch hơn trong các phương pháp phát triển AI
Quy định rõ ràng hơn về việc sử dụng tài liệu có bản quyền để huấn luyện AI
Một cuộc thảo luận rộng rãi hơn về đạo đức của việc thu thập dữ liệu quy mô lớn cho các ứng dụng AI thương mại

Khi AI tiếp tục phát triển, ngành công nghệ phải đối mặt với những thách thức pháp lý và đạo đức phức tạp này để đảm bảo sự đổi mới có trách nhiệm.


Chủ tịch Nvidia Jensen Huang giới thiệu siêu chip Grace Hopper tiên tiến, biểu tượng cho những đổi mới công nghệ cao đang là trọng tâm của các cuộc tranh luận đạo đức hiện tại trong phát triển AI

Tin tức liên quan

Apple sử dụng TPU của Google, không phải GPU của Nvidia, để huấn luyện mô hình AI

1 tháng trước

T-Mobile đối mặt với phản ứng dữ dội về cáo buộc thực hành bán hàng phi đạo đức

1 tháng trước

Apple phủ nhận việc sử dụng phụ đề YouTube để huấn luyện AI, làm rõ nguồn dữ liệu

2024-07-19

‌

‌
‌

‌

‌
‌

‌