Browser-use, một công cụ mã nguồn mở được thiết kế để cho phép các tác nhân AI điều khiển trình duyệt web, đã làm dấy lên nhiều cuộc thảo luận trong cộng đồng về những tác động bảo mật của nó. Mặc dù công cụ này hứa hẹn sẽ cách mạng hóa việc tự động hóa trình duyệt bằng cách cho phép AI thực hiện các tác vụ web phức tạp, các chuyên gia bảo mật đã nêu lên những lo ngại về cách tiếp cận điều khiển trình duyệt và các lỗ hổng tiềm ẩn.
Lỗ hổng bảo mật trong chế độ gỡ lỗi trình duyệt
Mối quan ngại nổi bật nhất được các thành viên cộng đồng nêu ra tập trung vào việc triển khai công cụ gỡ lỗi của Chrome trong Browser-use. Một người dùng đã chỉ ra rằng thư viện này sử dụng Chrome DevTools Protocol (CDP) và hướng dẫn người dùng khởi chạy Chrome ở chế độ gỡ lỗi, điều này có thể tạo ra những rủi ro bảo mật nghiêm trọng:
Quên đi vấn đề về tác nhân, hướng dẫn thiết lập đã xuất bản của Browser-use để sử dụng với hồ sơ Chrome và mật khẩu riêng của bạn sẽ khởi chạy một phiên Chrome với chế độ gỡ lỗi từ xa được bật. Những công cụ mà họ đang hướng dẫn người dùng thiết lập và thực thi vốn không an toàn.
Các công cụ gỡ lỗi được Browser-use sử dụng có những lỗ hổng đã biết mà Google được cho là không khắc phục vì chúng chỉ dành cho mục đích phát triển chứ không phải môi trường sản xuất. Khi người dùng làm theo hướng dẫn trong tài liệu để kết nối với trình duyệt thực tế của họ cùng với thông tin đăng nhập và mật khẩu đã lưu, họ có thể tiếp xúc với các cuộc tấn công cross-site scripting (XSS) vì cổng DevTools thiếu xác thực.
Các vấn đề bảo mật chính khi sử dụng trình duyệt:
- Sử dụng Chrome DevTools Protocol (CDP) vốn có những lỗ hổng bảo mật đã được biết đến
- Hướng dẫn người dùng khởi chạy Chrome ở chế độ gỡ lỗi với Remote Debugging được bật
- Cổng DevTools thiếu xác thực, khiến nó dễ bị tấn công XSS
- Có khả năng lộ thông tin đăng nhập và mật khẩu đã lưu
Các giải pháp thay thế được đề xuất:
- Sử dụng ChromeDriver thay vì chế độ gỡ lỗi
- Sử dụng Unix sockets cho CDP để giảm thiểu lỗ hổng xác thực
- Cách ly container (mặc dù điều này không giải quyết hoàn toàn vấn đề với kết nối trình duyệt chính)
Các phương pháp tiếp cận thay thế và giải pháp
Các nhà phát triển có ý thức về bảo mật trong cuộc thảo luận đã đề xuất các phương pháp thay thế để điều khiển trình duyệt. Một số đề cập đến việc sử dụng ChromeDriver thay vì chế độ gỡ lỗi, trong khi những người khác chỉ ra unix sockets cho CDP như một giải pháp tiềm năng để giảm thiểu lỗ hổng xác thực. Một người bình luận lưu ý rằng họ đã phát triển một cách an toàn để điều khiển trình duyệt với các tác nhân AI mà không cần quyền gỡ lỗi.
Những người duy trì dự án đã ghi nhận những lo ngại này nhưng chưa cam kết một thiết kế lại tập trung vào bảo mật cụ thể. Họ gợi ý rằng khi chạy trong môi trường sản xuất, các trình duyệt thường nằm trong các container Docker biệt lập, mặc dù các nhà phê bình chỉ ra rằng điều này không giải quyết được vấn đề khi người dùng làm theo tài liệu để kết nối với trình duyệt chính của họ.
Tích hợp MCP và tiêu chuẩn hóa
Ngoài bảo mật, một chủ đề thảo luận quan trọng khác tập trung vào việc tích hợp Model Context Protocol (MCP). Nhiều người dùng bày tỏ sự quan tâm đến việc Browser-use áp dụng MCP để tiêu chuẩn hóa các tương tác công cụ với các mô hình ngôn ngữ lớn (LLM). Mặc dù ban đầu do dự về giá trị của MCP, các nhà phát triển dường như đã xem xét lại sau khi thấy sự quan tâm của cộng đồng:
Tôi đã rất phản đối điều đó nhưng bài đăng trên HN này khiến tôi nghĩ 'mọi người muốn MCP', một trong những nhà phát triển lưu ý, nhấn mạnh cách phản hồi từ cộng đồng đang định hình hướng đi của dự án.
MCP có thể giúp Browser-use tương thích với nhiều nền tảng và trường hợp sử dụng hơn, với một số người dùng đề cập rằng họ hiện đang sử dụng các giải pháp thay thế cụ thể vì Browser-use thiếu hỗ trợ MCP.
Cân nhắc đạo đức và thực hành thu thập dữ liệu web
Cộng đồng cũng nêu lên những lo ngại về tự động hóa web có trách nhiệm. Một số người bình luận chỉ ra rằng các tác nhân AI đã dẫn đến hoạt động thu thập dữ liệu tăng lên mà không phải lúc nào cũng tuân theo các thông lệ tốt nhất đã thiết lập như tôn trọng tệp robots.txt hoặc triển khai giới hạn tốc độ. Điều này có thể ảnh hưởng tiêu cực đến chủ sở hữu trang web thông qua chi phí tăng và thời gian ngừng hoạt động tiềm ẩn.
Các nhà phát triển gợi ý rằng cách tiếp cận của họ thực sự giảm tải so với phương pháp thu thập dữ liệu truyền thống vì họ chỉ trích xuất các phần tử tương tác thay vì tải xuống tất cả tài nguyên. Họ cũng lưu ý rằng về lâu dài, họ tin rằng các tác nhân sẽ phải trả tiền cho dữ liệu từ các nhà cung cấp trang web, điều này sẽ tái cân bằng động lực.
Khi Browser-use tiếp tục phát triển cả khung mã nguồn mở và dịch vụ đám mây của mình, những cuộc thảo luận xung quanh bảo mật, tiêu chuẩn hóa và tương tác web có đạo đức này có thể sẽ định hình sự phát triển của nó. Giấy phép MIT của dự án đã cho phép việc áp dụng rộng rãi, nhưng cũng đặt ra câu hỏi về áp lực cạnh tranh tiềm ẩn từ các công ty lớn hơn có thể cung cấp các dịch vụ tương tự.
Đối với các nhà phát triển quan tâm đến tự động hóa trình duyệt với AI, Browser-use đại diện cho một công cụ thú vị nhưng đang phát triển, đòi hỏi xem xét cẩn thận các tác động bảo mật khi triển khai trong môi trường sản xuất.