Trợ lý AI điện thoại gây ra những lo ngại lớn về quyền riêng tư và bảo mật bất chấp khả năng ấn tượng

BigGo Editorial Team
Trợ lý AI điện thoại gây ra những lo ngại lớn về quyền riêng tư và bảo mật bất chấp khả năng ấn tượng

Việc giới thiệu gần đây về PhoneAgent , một hệ thống AI có thể điều khiển iPhone qua nhiều ứng dụng bằng các lệnh ngôn ngữ tự nhiên, đã gây ra cuộc tranh luận gay gắt về những tác động đến quyền riêng tư và bảo mật của các trợ lý AI có quyền truy cập toàn hệ thống. Được xây dựng trong một hackathon của OpenAI , công cụ thử nghiệm này cho thấy cả tiềm năng ấn tượng lẫn những rủi ro đáng báo động của các hệ thống AI tự động.

Cơn ác mộng về quyền riêng tư: Cái giá của sự tiện lợi

Mối quan tâm cốt lõi tập trung vào các quyền truy cập rộng rãi mà những trợ lý AI này yêu cầu để hoạt động hiệu quả. Để thực hiện các tác vụ phức tạp như đặt vé máy bay và nhắn tin với bạn bè, một trợ lý AI sẽ cần quyền truy cập vào trình duyệt, thông tin thanh toán, lịch, ứng dụng nhắn tin, và về cơ bản là các quyền cấp root trên toàn bộ hệ thống. Điều này tạo ra cái mà các chuyên gia gọi là vấn đề hàng rào máu não giữa các ứng dụng và hệ điều hành.

Vậy nên có một vấn đề sâu sắc về bảo mật và quyền riêng tư đang ám ảnh loại sự cường điệu xung quanh các trợ lý này, và điều đó cuối cùng đe dọa phá vỡ hàng rào máu não giữa lớp ứng dụng và lớp hệ điều hành bằng cách kết hợp tất cả những dịch vụ riêng biệt này, làm lẫn lộn dữ liệu của chúng, và làm những việc như làm suy yếu quyền riêng tư của các tin nhắn Signal của bạn.

Việc triển khai kỹ thuật của PhoneAgent cho thấy những thách thức này trong thực tế. Hệ thống sử dụng framework kiểm thử giao diện người dùng của Xcode để vượt qua các hạn chế sandboxing của iOS , cho phép nó tương tác với bất kỳ ứng dụng nào trên thiết bị. Mặc dù cách tiếp cận này tránh được yêu cầu jailbreak, nó cũng cho thấy cách các trợ lý AI phải vượt qua các biện pháp bảo mật hiện có để đạt được chức năng của chúng.

Thông số kỹ thuật của PhoneAgent:

  • Mô hình AI: OpenAI GPT-4.1
  • Nền tảng: iOS (thông qua framework kiểm thử giao diện người dùng Xcode)
  • Khả năng chính:
    • Truy cập vào cây khả năng tiếp cận của ứng dụng
    • Chạm, vuốt, cuộn, gõ và mở ứng dụng
    • Hỗ trợ lệnh giọng nói với tính năng phát hiện từ đánh thức
    • Chế độ lắng nghe nền luôn bật
  • Giao tiếp: Máy chủ TCP giữa ứng dụng chủ và kiểm thử giao diện người dùng
  • Bảo mật: Khóa API được lưu trữ trong keychain của thiết bị

Vấn đề kiểm soát: Khi các trợ lý AI hành động không thể đoán trước

Các cuộc thảo luận trong cộng đồng đã nêu bật những câu hỏi cơ bản về hành vi và kiểm soát của trợ lý AI. Thách thức không chỉ là kỹ thuật mà còn là triết học - làm thế nào chúng ta đảm bảo các hệ thống AI hiểu được hậu quả thực tế của hành động của chúng? Các mô hình AI hiện tại xuất sắc trong việc tuân theo hướng dẫn nhưng có thể thiếu sự hiểu biết ngữ cảnh để nhận ra khi nào hành động của chúng có thể gây ra tác hại.

Sự không chắc chắn này trở nên đặc biệt đáng lo ngại khi các trợ lý AI hoạt động với các quyền hệ thống rộng rãi. Không giống như phần mềm truyền thống với các mẫu hành vi có thể dự đoán, các trợ lý AI có thể diễn giải các lệnh theo những cách bất ngờ, có khả năng dẫn đến những hậu quả ngoài ý muốn trên nhiều ứng dụng và dịch vụ.

Những Hạn chế Hiện tại:

  • Các vấn đề về độ chính xác khi nhập liệu bằng bàn phím
  • Nhầm lẫn trong quá trình hoạt ảnh giao diện người dùng
  • Từ bỏ tác vụ sớm đối với các hoạt động chạy trong thời gian dài
  • Không có khả năng hiển thị màn hình trực quan (chỉ có cây khả năng tiếp cận)
  • Yêu cầu truyền dữ liệu đến máy chủ OpenAI
  • Phần mềm thử nghiệm có khả năng xảy ra lỗi

Hạn chế kỹ thuật và tác động tương lai

Những hạn chế hiện tại của PhoneAgent cho thấy cả giai đoạn đầu của công nghệ này và các lĩnh vực cần cải thiện. Hệ thống gặp khó khăn với việc nhập bàn phím, bị nhầm lẫn trong các hoạt ảnh, và không chờ đợi các tác vụ chạy lâu hoàn thành. Quan trọng hơn, hiện tại nó gửi nội dung ứng dụng đến các máy chủ của OpenAI để xử lý, làm nổi bật những lo ngại về xử lý dữ liệu ngoài thiết bị.

Nhìn về phía trước, cộng đồng hình dung các trợ lý AI trở nên ngày càng tinh vi, có khả năng phát triển thành các hệ thống tự động có khả năng quản lý tài nguyên và tự sao chép. Mặc dù điều này vẫn còn là suy đoán, nó nhấn mạnh tầm quan trọng của việc giải quyết các vấn đề bảo mật và kiểm soát trước khi những công nghệ này trở nên phổ biến hơn.

Sự tương phản giữa các cuộc trình diễn ấn tượng của PhoneAgent và cách tiếp cận thận trọng hơn của Apple Intelligence của Apple phản ánh sự căng thẳng rộng lớn hơn trong ngành giữa đổi mới và trách nhiệm. Khi các trợ lý AI trở nên có khả năng hơn, thách thức sẽ là cân bằng tính hữu ích của chúng với các nguyên tắc quyền riêng tư và bảo mật cơ bản bảo vệ người dùng.

Tham khảo: PhoneAgent