Các nhà phát triển luôn tìm kiếm cách để tối ưu hóa quy trình làm việc và giảm thời gian dành cho các tác vụ lặp đi lặp lại. Một trong những tác vụ thường chiếm nhiều giờ phát triển quý giá là kiểm thử và gỡ lỗi trình duyệt thủ công. Một công cụ mới từ operative.sh nhằm giải quyết vấn đề này bằng cách tự động hóa quá trình kiểm thử trình duyệt thông qua tác nhân được hỗ trợ bởi AI.
Kiểm Thử Trình Duyệt Tự Động với Tương Tác Giống Con Người
Web-eval-agent MCP Server từ operative.sh cho phép các nhà phát triển giao nhiệm vụ kiểm thử trình duyệt cho một tác nhân AI tương tác với các ứng dụng web giống như một người dùng thực. Tác nhân có thể điều hướng qua các trang web, nhấp vào các nút, điền vào biểu mẫu và thực hiện các luồng người dùng phức tạp trong khi thu thập thông tin gỡ lỗi giá trị. Điều làm nổi bật công cụ này là khả năng sử dụng nhận dạng hình ảnh để xác định các phần tử UI ngay cả khi chúng không được gắn nhãn rõ ràng trong mã, bắt chước cách một người kiểm thử tiếp cận nhiệm vụ.
Sức mạnh ở đây là tác nhân lập trình có khả năng kiểm tra trực quan - giống như con người. Vì vậy, nếu nút không hiển thị, tác nhân trình duyệt sẽ sử dụng thị giác để phát hiện rằng nó bị thiếu. Nó kiểm tra 'giống như con người' để đảm bảo luồng được triển khai hoạt động như mong đợi.
Các tính năng chính của web-eval-agent của operative.sh
- Điều hướng tự động sử dụng BrowserUse (được cho là nhanh hơn 2 lần với backend operative)
- Thu thập và lọc lưu lượng mạng thông minh
- Thu thập lỗi và nhật ký console
- Khả năng kiểm thử end-to-end
- Nhận diện phần tử trực quan (có thể nhận diện các phần tử UI như con người)
Các tùy chọn cài đặt
- macOS/Linux: Có sẵn script cài đặt tự động
- Windows: Cài đặt thủ công qua Cline với các bước cụ thể được cung cấp
- Yêu cầu tiên quyết bao gồm brew, npm, và jq cho người dùng macOS/Linux
Hạn chế hiện tại
- Trạng thái trình duyệt mới trong mỗi lần khởi chạy (không lưu trữ cookie/localStorage)
- Phải thực hiện xác thực cho mỗi phiên kiểm thử
- Vấn đề về khả năng mở rộng tiềm ẩn với các ứng dụng phức tạp
Thông Tin Gỡ Lỗi Toàn Diện
MCP Server không chỉ thực hiện các hành động; nó còn thu thập và tổ chức dữ liệu gỡ lỗi giá trị giúp các nhà phát triển nhanh chóng xác định vấn đề. Mỗi lần chạy kiểm thử tạo ra một báo cáo chi tiết bao gồm các bước của tác nhân, nhật ký bảng điều khiển, yêu cầu mạng và dòng thời gian theo trình tự của các sự kiện. Cái nhìn toàn diện này cho phép các nhà phát triển xác định chính xác nơi xảy ra vấn đề mà không cần phải tái tạo thủ công các vấn đề hoặc sàng lọc qua các nhật ký.
Thách Thức Quản Lý Trạng Thái Trình Duyệt
Hiện tại, một hạn chế của công cụ là nó bắt đầu với trạng thái trình duyệt mới mỗi khi khởi chạy, yêu cầu người dùng phải xác thực lại cho mỗi phiên kiểm thử. Các nhà phát triển thừa nhận hạn chế này và đang làm việc trên tính năng lưu trữ trạng thái trình duyệt để cho phép tác nhân duy trì phiên đăng nhập qua các lần chạy kiểm thử. Cải tiến này sẽ cải thiện đáng kể trải nghiệm kiểm thử cho các ứng dụng yêu cầu xác thực.
Cân Nhắc về Đánh Giá và Điểm Chuẩn
Thảo luận cộng đồng cho thấy sự quan tâm đến các điểm chuẩn để đánh giá hiệu quả của các tác nhân kiểm thử trình duyệt. Nhóm operative.sh ban đầu xây dựng trên công nghệ browser-use do các chỉ số đánh giá mạnh mẽ của nó nhưng đang xem xét chuyển sang tác nhân trình duyệt của Laminar, mà họ tin rằng cung cấp hiệu suất được cải thiện. Điều này nhấn mạnh bản chất phát triển của các công cụ kiểm thử được hỗ trợ bởi AI và tầm quan trọng của các phương pháp đánh giá tiêu chuẩn hóa.
Đối với các nhà phát triển mệt mỏi với việc phải nhấp chuột qua các ứng dụng của họ để xác minh chức năng, phương pháp kiểm thử tự động này hứa hẹn sẽ tiết kiệm thời gian đáng kể trong khi cung cấp phạm vi kiểm thử toàn diện hơn. Như một thành viên cộng đồng đã lưu ý, việc loại bỏ các thao tác nhấp chuột và kiểm tra lặp đi lặp lại đại diện cho một bước tiến lớn cho năng suất của nhà phát triển. Mặc dù vẫn còn câu hỏi về khả năng mở rộng của hệ thống đối với các ứng dụng phức tạp, hướng đi này có vẻ đầy hứa hẹn cho tương lai của quy trình phát triển được hỗ trợ bởi AI.
Tham khảo: operative.sh web-eval-agent MCP Server