Khả năng suy luận hình ảnh mới của ChatGPT gây lo ngại nghiêm trọng về quyền riêng tư khi người dùng phát hiện khả năng đoán vị trí

BigGo Editorial Team
Khả năng suy luận hình ảnh mới của ChatGPT gây lo ngại nghiêm trọng về quyền riêng tư khi người dùng phát hiện khả năng đoán vị trí

Các mô hình AI mới nhất của OpenAI đã thể hiện khả năng đáng kinh ngạc trong việc xác định vị trí từ ảnh với rất ít manh mối trực quan, làm dấy lên sự thích thú và lo ngại trong cộng đồng người dùng và những người ủng hộ quyền riêng tư. Khả năng mới này thể hiện một bước tiến đáng kể trong suy luận hình ảnh của AI nhưng cũng mang đến những rủi ro tiềm ẩn cho quyền riêng tư cá nhân trong kỷ nguyên số.

Xu hướng GeoGuessr mới

Các mô hình o3 và o4-mini mới phát hành của OpenAI đã tạo ra một xu hướng viral, nơi người dùng thách thức AI xác định vị trí từ ảnh được tải lên, tương tự như trò chơi trực tuyến GeoGuessr. Người dùng đã tải lên nhiều hình ảnh khác nhau, từ thực đơn nhà hàng đến kệ sách thư viện, và yêu cầu AI xác định nơi chúng được chụp. Kết quả đã chính xác đến mức đáng kinh ngạc, với các mô hình xác định đúng vị trí cụ thể dựa trên những chi tiết tưởng chừng như không đáng kể mà hầu hết con người sẽ bỏ qua.

Các mô hình OpenAI có khả năng phân tích hình ảnh:

  • mô hình o3
  • mô hình o4-mini

Khả năng kỹ thuật đằng sau độ chính xác

Các mô hình mới có khả năng suy luận hình ảnh nâng cao cho phép chúng phân tích hình ảnh một cách toàn diện. Chúng có thể cắt, xoay và phóng to ảnh, ngay cả những ảnh có chất lượng kém. Ấn tượng hơn, chúng có thể tích hợp hình ảnh trực tiếp vào chuỗi suy nghĩ của mình, hiệu quả trong việc tư duy bằng thông tin hình ảnh thay vì chỉ xử lý nó. Điều này cho phép kết hợp tinh vi giữa suy luận hình ảnh và văn bản, giúp các mô hình phát hiện những manh mối tinh tế về vị trí.

Các khả năng xử lý hình ảnh chính:

  • Cắt, xoay và phóng to ảnh
  • Phân tích hình ảnh chất lượng kém
  • Tích hợp hình ảnh vào quá trình suy luận chuỗi
  • Nhận diện vị trí dựa trên các dấu hiệu hình ảnh tinh tế

Tác động đến quyền riêng tư và lo ngại về Doxxing

Mặc dù nhiều người dùng thấy chức năng tìm kiếm vị trí ngược này thú vị, nó làm dấy lên những lo ngại nghiêm trọng về quyền riêng tư, đặc biệt liên quan đến doxxing—việc tiết lộ công khai vị trí hoặc thông tin cá nhân của ai đó. Khả năng xác định vị trí chính xác từ những bức ảnh thông thường đăng trên mạng xã hội có thể bị lợi dụng để theo dõi cá nhân mà không cần sự đồng ý hoặc biết đến của họ. Một tấm ảnh selfie với ít chi tiết nền hoặc một bài đăng mạng xã hội vô hại có thể tiết lộ nhiều thông tin hơn người đăng dự định.

Ví dụ thực tế về độ chính xác

Độ chính xác của các mô hình này đã được chứng minh qua nhiều ví dụ được chia sẻ trên mạng xã hội. Trong một trường hợp, ChatGPT đã xác định đúng thư viện Đại học Melbourne từ một hình ảnh cắt gọn của sách trên kệ. Trong một trường hợp khác, nó suy luận rằng một bức ảnh được chụp ở Suriname dựa trên quan sát rằng xe hơi có vô lăng bên trái nhưng lại lái ở làn đường bên trái—một sự kết hợp chỉ có ở một vài quốc gia trên thế giới. Mô hình thậm chí còn có thể xác định một quán bar bí mật cụ thể ở Williamsburg chỉ dựa vào một đầu tê giác màu tím gắn trong quán bar.

Phản hồi của OpenAI đối với những lo ngại

OpenAI đã thừa nhận các vấn đề quyền riêng tư tiềm ẩn liên quan đến những khả năng này. Một người phát ngôn cho biết công ty đã triển khai các biện pháp bảo vệ nhằm ngăn chặn các mô hình xác định cá nhân trong hình ảnh và đã huấn luyện chúng từ chối các yêu cầu về thông tin riêng tư hoặc nhạy cảm. Công ty nhấn mạnh rằng công nghệ suy luận hình ảnh có những ứng dụng có lợi trong các lĩnh vực như khả năng tiếp cận, nghiên cứu và ứng phó khẩn cấp.

Biện pháp bảo vệ quyền riêng tư được đề cập bởi OpenAI:

  • Các mô hình được huấn luyện để từ chối các yêu cầu về thông tin riêng tư/nhạy cảm
  • Các biện pháp bảo vệ để ngăn chặn việc nhận dạng cá nhân trong hình ảnh
  • Giám sát tích cực đối với các vi phạm chính sách

Giới hạn của công nghệ

Mặc dù có hiệu suất ấn tượng, công nghệ này không phải là không thể sai sót. Cả hai bài báo đều lưu ý rằng các mô hình không phải lúc nào cũng đoán đúng, và đôi khi mô hình o3 có thể bị mắc kẹt trong một vòng lặp khi cố gắng xác định vị trí. Thú vị là, TechCrunch đã báo cáo rằng mô hình GPT-4o trước đó, vốn thiếu các khả năng suy luận hình ảnh cụ thể, có thể cung cấp các câu trả lời về vị trí tương tự trong nhiều trường hợp và đôi khi còn làm như vậy nhanh hơn o3.

Ảnh hưởng đối với người dùng mạng xã hội

Sự phát triển này là một lời nhắc nhở rõ ràng cho người dùng mạng xã hội cần thận trọng hơn về những hình ảnh họ chia sẻ công khai. Ngay cả những chi tiết tưởng chừng như vô hại trong nền của ảnh cũng có thể tiết lộ thông tin vị trí khi được phân tích bởi các mô hình AI ngày càng tinh vi này. Đối với những người quan tâm đến quyền riêng tư, việc hạn chế lượng thông tin hình ảnh chia sẻ trực tuyến có thể trở nên ngày càng quan trọng khi các công nghệ này tiếp tục phát triển.